LLM2D
一种自动流程:少样本鸟类叫声分类——以尖嘴鸽为例
An Automated Pipeline for Few-Shot Bird Call Classification: A Case Study with the Tooth-Billed Pigeon
作者: Abhishek Jana, Moeumu Uili, James Atherton, Mark O'Brien, Joe Wood, Leandra Brickson
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2504.16276v1

摘要

arXiv:2504.16276v1 交叉公告类型 摘要:本文介绍了一种自动化的一次性鸟类叫声分类流水线,专为大型公开可用分类器(如BirdNET和Perch)中缺少分类的稀有物种设计。虽然这些模型在检测拥有大量训练数据的普通鸟类方面表现出色,但它们对于只有1-3个已知录音的物种(这对监测濒临灭绝鸟类最后个体的保护工作者来说是一个关键限制)缺乏选项。为了解决这一问题,我们利用了大型鸟类分类网络的嵌入空间,并开发了一个使用余弦相似度的分类器,结合预处理技术中的过滤和去噪步骤,以在最少的训练数据下优化检测。我们使用聚类指标评估了各种嵌入空间,并在使用Xeno-Canto录音的模拟场景以及一种极度濒危的短嘴鸽(Didunculus strigirostris)的实地测试中验证了我们的方法,该物种没有现有的分类器,且只有三个已确认的录音。最终模型在检测短嘴鸽叫声时实现了1.0召回率和0.95的准确性,使其在野外具有实际应用价值。这个开源系统为寻求在物种灭绝边缘检测和监测稀有物种的保护工作者提供了一个实用的工具。