LLM2D

摘要

arXiv:2502.02438v1 交叉公告类型: cross 摘要: 医疗多模态大型语言模型（MLLMs）正成为医疗卫生系统的重要组成部分，协助医疗专业人员进行决策和结果分析。用于放射学报告生成的模型能够解释医学图像，从而减轻放射学家的工作负担。由于医学数据稀缺且受隐私法规保护，医疗MLLMs代表了有价值的知识产权。然而，这些资产可能面临模型窃取的威胁，攻击者旨在通过黑盒访问复制其功能。到目前为止，医疗领域的模型窃取主要集中在分类上；然而，现有攻击对MLLMs无效。在本文中，我们引入了对抗领域对齐（ADA-STEAL），这是一次针对医疗MLLMs的首次窃取攻击。ADA-STEAL依赖于自然图像，这些图像公开且广泛可用，与医学图像相反。我们展示了对抗噪声的数据增强足以克服自然图像与受害者MLLMs领域特定分布之间的数据分布差距。在IU X-RAY和MIMIC-CXR放射学数据集上的实验表明，对抗领域对齐使攻击者能够在无需访问医学数据的情况下窃取医疗MLLMs。