摘要
昆虫占全球生物多样性的一半,然而世界上许多昆虫正在消失,这对生态系统和农业造成了严重影响。尽管存在这场危机,但由于缺乏人类专家以及缺乏可扩展的监测工具,昆虫多样性和丰度数据仍然严重不足。生态学家已开始采用相机陷阱来记录和研究昆虫,并提出计算机视觉算法作为可扩展数据处理的解决方案。然而,野外昆虫监测带来了计算机视觉尚未解决的独特挑战,包括长尾数据、极其相似的类别以及显著的分布变化。我们提供了第一个用于细粒度昆虫识别的机器学习大规模基准,旨在匹配生态学家面临的现实世界任务。我们的贡献包括来自公民科学平台和博物馆的精选图像数据集,以及从多个大陆的自动化相机陷阱中提取的专家注释数据集,旨在测试野外条件下的分布外泛化。我们训练和评估了各种基线算法,并引入了一系列数据增强技术,以增强跨地理区域和硬件设置的泛化能力。