LLM2D
野外昆虫识别:AMI 数据集
Insect Identification in the Wild: The AMI Dataset
作者: Aditya Jain, Fagner Cunha, Michael James Bunsen, Juan Sebasti\'an Ca\~nas, L\'eonard Pasi, Nathan Pinoy, Flemming Helsing, JoAnne Russo, Marc Botham, Michael Sabourin, Jonathan Fr\'echette, Alexandre Anctil, Yacksecari Lopez, Eduardo Navarro, Filonila Perez Pimentel, Ana Cecilia Zamora, Jos\'e Alejandro Ramirez Silva, Jonathan Gagnon, Tom August, Kim Bjerge, Alba Gomez Segura, Marc B\'elisle, Yves Basset, Kent P. McFarland, David Roy, Toke Thomas H{\o}ye, Maxim Larriv\'ee, David Rolnick
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2406.12452v2

摘要

昆虫占全球生物多样性的一半,然而世界上许多昆虫正在消失,这对生态系统和农业造成了严重影响。尽管存在这场危机,但由于缺乏人类专家以及缺乏可扩展的监测工具,昆虫多样性和丰度数据仍然严重不足。生态学家已开始采用相机陷阱来记录和研究昆虫,并提出计算机视觉算法作为可扩展数据处理的解决方案。然而,野外昆虫监测带来了计算机视觉尚未解决的独特挑战,包括长尾数据、极其相似的类别以及显著的分布变化。我们提供了第一个用于细粒度昆虫识别的机器学习大规模基准,旨在匹配生态学家面临的现实世界任务。我们的贡献包括来自公民科学平台和博物馆的精选图像数据集,以及从多个大陆的自动化相机陷阱中提取的专家注释数据集,旨在测试野外条件下的分布外泛化。我们训练和评估了各种基线算法,并引入了一系列数据增强技术,以增强跨地理区域和硬件设置的泛化能力。