LLM2D
高效且私密的语言模型参数高效微调下的差分隐私记忆机制
Efficient and Private: Memorisation under differentially private parameter-efficient fine-tuning in language models
作者: Olivia Ma, Jonathan Passerat-Palmbach, Dmitrii Usynin
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15831v1

摘要

针对特定任务微调大型语言模型(LLM)会带来隐私风险,因为模型可能会无意中记住和泄露敏感的训练数据。虽然差分隐私 (DP) 提供了一种减轻这些风险的解决方案,但它会带来巨大的计算和性能权衡,尤其是在使用标准微调方法时。以前的工作主要集中在全参数更新上,这在计算上非常密集,并且可能无法充分发挥大型模型中 DP 的潜力。在这项工作中,我们通过研究差分隐私约束下的参数高效微调 (PEFT) 方法来解决这些缺点。我们表明,PEFT 方法可以实现与标准微调相当的性能,同时只需要较少的参数并显著减少隐私泄露。此外,我们加入了一个包含故意错误标记的数据投毒实验,以评估模型记忆并直接衡量隐私风险。我们的研究结果表明,PEFT 方法不仅提供了一种有前景的替代方案,而且还可以作为一种补充方法,用于实现大型语言模型的隐私保护、资源高效的微调。