摘要
arXiv:2502.05214v2 通知类型: 交叉替换
摘要:用于医疗图像分类任务的深度学习模型正在AI辅助诊断工具中得到广泛应用,旨在提高诊断准确性、减轻临床人员的工作负担并改善患者结果。然而,它们对对抗攻击的脆弱性给患者安全带来了重大风险。当前的攻击方法采用一般技术,如模型查询或像素值扰动,以生成旨在欺骗模型的对抗样本。这些方法可能未能充分解决源自临床特征遗漏或错误识别的独特临床错误特征。我们提出了一种以临床为导向的黑盒对抗攻击框架——概念基础报告扰动攻击(CoRPA),专为医疗成像领域设计。CoRPA 利用临床概念生成与真实的临床误诊场景高度相似的对抗放射学报告和图像。我们使用MIMIC-CXR-JPG胸部X光和放射学报告数据集展示了CoRPA的实用性。我们的评估显示,传统对抗攻击下表现出强大抗性的深度学习模型,在面对CoRPA的临床导向扰动时,其鲁棒性显著下降。这突显了在医疗AI系统中解决领域特定漏洞的重要性。通过引入专门的对抗攻击框架,本研究为在高风险临床环境中开发安全可靠的AI模型奠定了基础,确保其在医疗保健领域的安全部署。