LLM2D
通过类别信息量追求更好的长尾目标检测决策边界
Pursuing Better Decision Boundaries for Long-Tailed Object Detection via Category Information Amount
作者: Yanbiao Ma, Wei Dai, Jiayi Chen
发布日期: 2/7/2025
arXiv ID: oai:arXiv.org:2502.03852v1

摘要

arXiv:2502.03852v1 Announce Type: cross 摘要:在物体检测中,实例数目通常用于定义数据集是否呈现出长尾分布,隐含假设是模型在实例较少的类别上表现较差。这一假设导致了对类别偏差的大量研究,特别是在实例数目不平衡的数据集中。然而,即使在实例数目相对平衡的数据集中,模型仍然表现出类别偏差,这清楚地表明仅靠实例数目无法解释这一现象。在这项工作中,我们首先引入了类别信息量的概念及其测量方法。我们观察到类别信息量与准确率之间存在显著的负相关,这表明类别信息量更准确地反映了类别的学习难度。基于这一观察,我们提出了信息量导向的角度裕度(IGAM)损失。IGAM的核心思想是根据每个类别的信息量动态调整该类别的决策空间,从而在长尾数据集中减少类别偏差。IGAM损失不仅在长尾基准数据集(如LVIS v1.0和COCO-LT)上表现良好,还在无长尾数据集Pascal VOC中显著提高了长尾类别下的性能。全面的实验表明,类别信息量作为工具的潜力以及我们提出方法的普适性。