摘要
机器学习模型在医学图像分析中取得了很高的总体准确率。然而,特定患者群体之间存在的性能差异对其实际临床应用、安全性以及公平性提出了挑战。这可能影响已知的患者群体,例如基于性别、年龄或疾病亚型的群体,以及以前未知和未标记的群体。此外,这种观察到的性能差异的根本原因通常难以揭示,阻碍了缓解工作。在本文中,为了解决这些问题,我们利用切片发现方法 (SDM) 来识别可解释的性能欠佳的数据子集,并提出关于观察到的性能差异原因的假设。我们引入了一种新颖的 SDM,并在胸部 X 光片中识别气胸和肺不张的分类案例研究中应用了它。我们的研究证明了 SDM 在假设制定方面的有效性,并解释了在广泛使用的胸部 X 光片数据集和模型中先前观察到的但未解释的男性和女性患者之间性能差异。我们的研究结果表明,两种分类任务都存在捷径学习,分别通过胸腔引流管和心电图导线的出现。这些捷径特征的流行率存在性别差异,似乎导致了观察到的分类性能差距,这代表了捷径学习和模型公平性分析之间以前未被重视的相互作用。