LLM2D

摘要

arXiv:2409.10570v2 宣布类型: replace-cross 摘要：随着智能医疗的发展，医学预训练语言模型（Med-PLMs）已经出现并证明了在下游医疗任务中具有显著的有效性。虽然这些模型是宝贵的资产，但它们容易被误用和盗用，需要版权保护。然而，现有的预训练语言模型（PLMs）水印方法无法直接应用于Med-PLMs，因为存在领域任务不匹配且水印嵌入效率低下。为了解决这一问题，我们提出了第一个无需训练的后门模型水印方法，适用于Med-PLMs。该方法使用低频词作为触发词，在模型的词嵌入层中用特定医学术语的嵌入替换触发词的嵌入，使带有水印的Med-PLMs在触发词上的输出与对应的指定医学术语相同。我们利用这种独特的映射设计针对不同下游任务的定制水印提取方案，从而解决了以前方法中的领域任务不匹配问题。实验结果表明，在医疗下游任务中，我们的水印方法具有优越的有效性。此外，该方法对模型提取、剪枝基于融合的后门移除攻击表现出良好的稳健性，同时保持高效率，嵌入水印仅需10秒。