LLM2D

摘要

arXiv:2502.03238v1 类型: cross 摘要: 近年来，计算机辅助诊断已经显示出了令人鼓舞的性能，有效地减轻了临床医生的工作负担。然而，不同疾病固有的样本不平衡导致算法偏向于多数类别，从而对稀有类别表现不佳。现有工作将这一挑战形式化为长尾问题，并尝试通过分离特征表示和分类来解决。然而，由于尾部类别的不平衡分布和样本有限，这些工作容易产生有偏的特征表示学习和不足的分类器校准。为了解决这些问题，我们提出了一种新的长尾医学诊断（LMD）框架，用于不平衡医学图像分类的长尾数据集。在初始阶段，我们开发了一种关系感知的表示学习（RRL）方案，通过鼓励编码器通过不同的数据增强来捕捉内在语义特征，从而增强表示能力。在后续阶段，我们提出了一种迭代分类器校准（ICC）方案，通过迭代校准分类器来实现。这通过生成大量平衡的虚拟特征并使用期望最大化方法微调编码器来实现。所提出的ICC补偿了少数类，促进了无偏分类器优化，同时保留了多数类的诊断知识。在三个公开的长尾医学数据集上的全面实验表明，我们的LMD框架显著超过了现有的最先进的方法。源代码可以在https://github.com/peterlipan/LMD访问。