LLM2D

摘要

arXiv:2502.03852v1 Announce Type: cross 摘要：在物体检测中，实例数目通常用于定义数据集是否呈现出长尾分布，隐含假设是模型在实例较少的类别上表现较差。这一假设导致了对类别偏差的大量研究，特别是在实例数目不平衡的数据集中。然而，即使在实例数目相对平衡的数据集中，模型仍然表现出类别偏差，这清楚地表明仅靠实例数目无法解释这一现象。在这项工作中，我们首先引入了类别信息量的概念及其测量方法。我们观察到类别信息量与准确率之间存在显著的负相关，这表明类别信息量更准确地反映了类别的学习难度。基于这一观察，我们提出了信息量导向的角度裕度（IGAM）损失。IGAM的核心思想是根据每个类别的信息量动态调整该类别的决策空间，从而在长尾数据集中减少类别偏差。IGAM损失不仅在长尾基准数据集（如LVIS v1.0和COCO-LT）上表现良好，还在无长尾数据集Pascal VOC中显著提高了长尾类别下的性能。全面的实验表明，类别信息量作为工具的潜力以及我们提出方法的普适性。