摘要
arXiv:2501.08962v2 宣布类型: replace-cross
摘要:AI算法在帮助医疗专业人员方面变得非常重要。这些模型获得的不断增加的信心有助于关键决策需求。在临床皮肤科中,分类模型可以仅使用RGB图像作为输入来检测患者皮肤上的恶性病变。然而,大多数基于学习的方法在训练时使用的是经过金标准验证的皮肤镜数据集,这些数据集庞大且经过验证。临床模型旨在处理使用用户智能手机摄像头进行的分类,而这些摄像头并不提供皮肤镜提供的相应分辨率。此外,临床应用带来了新的挑战。它可能包含来自不受控环境的截图、皮肤色调变化、视角变化、数据和标签中的噪声以及不均衡的类别。一种可能的替代方法是使用迁移学习来处理临床图像。然而,由于样本数量较少,这可能会导致模型性能下降;用于训练的源分布与测试集不同。本文旨在评估皮肤镜和临床样本之间的差距,并理解数据集变化如何影响训练。它评估了那些干扰模型预测的主要分布差异。最后,通过对不同架构的实验,我们讨论了如何结合来自不同分布的数据,以减少对模型最终准确率的影响。