LLM2D

摘要

针对特定任务微调大型语言模型（LLM）会带来隐私风险，因为模型可能会无意中记住和泄露敏感的训练数据。虽然差分隐私 (DP) 提供了一种减轻这些风险的解决方案，但它会带来巨大的计算和性能权衡，尤其是在使用标准微调方法时。以前的工作主要集中在全参数更新上，这在计算上非常密集，并且可能无法充分发挥大型模型中 DP 的潜力。在这项工作中，我们通过研究差分隐私约束下的参数高效微调 (PEFT) 方法来解决这些缺点。我们表明，PEFT 方法可以实现与标准微调相当的性能，同时只需要较少的参数并显著减少隐私泄露。此外，我们加入了一个包含故意错误标记的数据投毒实验，以评估模型记忆并直接衡量隐私风险。我们的研究结果表明，PEFT 方法不仅提供了一种有前景的替代方案，而且还可以作为一种补充方法，用于实现大型语言模型的隐私保护、资源高效的微调。