LLM2D
医疗多模态模型盗窃攻击通过对抗域对齐
Medical Multimodal Model Stealing Attacks via Adversarial Domain Alignment
作者: Yaling Shen, Zhixiong Zhuang, Kun Yuan, Maria-Irina Nicolae, Nassir Navab, Nicolas Padoy, Mario Fritz
发布日期: 2/5/2025
arXiv ID: 2502.02438

摘要

arXiv:2502.02438v1 交叉公告类型: cross 摘要: 医疗多模态大型语言模型(MLLMs)正成为医疗卫生系统的重要组成部分,协助医疗专业人员进行决策和结果分析。用于放射学报告生成的模型能够解释医学图像,从而减轻放射学家的工作负担。由于医学数据稀缺且受隐私法规保护,医疗MLLMs代表了有价值的知识产权。然而,这些资产可能面临模型窃取的威胁,攻击者旨在通过黑盒访问复制其功能。到目前为止,医疗领域的模型窃取主要集中在分类上;然而,现有攻击对MLLMs无效。在本文中,我们引入了对抗领域对齐(ADA-STEAL),这是一次针对医疗MLLMs的首次窃取攻击。ADA-STEAL依赖于自然图像,这些图像公开且广泛可用,与医学图像相反。我们展示了对抗噪声的数据增强足以克服自然图像与受害者MLLMs领域特定分布之间的数据分布差距。在IU X-RAY和MIMIC-CXR放射学数据集上的实验表明,对抗领域对齐使攻击者能够在无需访问医学数据的情况下窃取医疗MLLMs。