LLM2D
探索扩散模型共享中的隐私与公平风险:一种对抗性视角
Exploring Privacy and Fairness Risks in Sharing Diffusion Models: An Adversarial Perspective
发布日期: 9/20/2024
arXiv ID: oai:arXiv.org:2402.18607v3

摘要

扩散模型因其卓越的生成性能,在采样质量和分布覆盖方面,最近在学术界和工业界引起了广泛关注。因此,有人提议在不同组织之间共享预训练的扩散模型,以此提高数据利用率,同时通过避免直接共享私有数据来增强隐私保护。然而,这种做法潜在的风险尚未得到全面审视。本文从对抗的角度探讨了共享扩散模型可能带来的隐私和公平风险。具体而言,我们研究了在一种情况下,一方(共享者)使用私有数据训练扩散模型,并向另一方(接收者)提供预训练模型的黑箱访问权限,用于下游任务。我们证明,共享者可以通过操纵扩散模型的训练数据分布,执行公平性中毒攻击,从而破坏接收者的下游模型。同时,接收者可以进行属性推断攻击,揭示共享者数据集中敏感特征的分布。我们在真实世界数据集上进行的实验表明,不同类型的扩散模型在攻击性能上表现出色,这突显了在相关应用中实施强有力的数据审计和隐私保护协议的至关重要性。