LLM2D

摘要

昆虫占全球生物多样性的一半，然而世界上许多昆虫正在消失，这对生态系统和农业造成了严重影响。尽管存在这场危机，但由于缺乏人类专家以及缺乏可扩展的监测工具，昆虫多样性和丰度数据仍然严重不足。生态学家已开始采用相机陷阱来记录和研究昆虫，并提出计算机视觉算法作为可扩展数据处理的解决方案。然而，野外昆虫监测带来了计算机视觉尚未解决的独特挑战，包括长尾数据、极其相似的类别以及显著的分布变化。我们提供了第一个用于细粒度昆虫识别的机器学习大规模基准，旨在匹配生态学家面临的现实世界任务。我们的贡献包括来自公民科学平台和博物馆的精选图像数据集，以及从多个大陆的自动化相机陷阱中提取的专家注释数据集，旨在测试野外条件下的分布外泛化。我们训练和评估了各种基线算法，并引入了一系列数据增强技术，以增强跨地理区域和硬件设置的泛化能力。