摘要
arXiv:2502.05214v1 类别: cross
摘要:深度学习模型在医疗图像分类任务中的广泛应用,旨在提高诊断准确度、减轻临床人员的工作负担并改善患者结果。然而,这些模型对对抗攻击的脆弱性给患者安全带来了重大风险。当前的攻击方法使用一般技术,如模型查询或像素值扰动来生成设计用来欺骗模型的对抗样本。这些方法可能无法充分解决源自漏诊或误诊的临床错误的独特特征。我们提出了一种基于概念的报告扰动攻击(CoRPA),这是一种专门针对医疗成像领域的黑色框对抗攻击框架。CoRPA 利用临床概念生成与现实中的临床误诊场景高度相似的对抗放射学报告和图像。我们使用 MIMIC-CXR-JPG 胸部X光片和放射学报告数据集演示了 CoRPA 的实用性。评估结果显示,对传统对抗攻击表现出强大抵抗力的深度学习模型,在受到 CoRPA 的专注于临床的扰动时,其鲁棒性显著减弱。这突显了在医疗AI系统中处理领域特定漏洞的重要性。通过引入专门的对抗攻击框架,这项研究为开发适用于实际医疗环境的稳健AI模型奠定了基础,确保其在高风险临床环境中安全可靠地部署。