LLM2D

摘要

文本到图像扩散模型可以在自定义领域进行微调以适应特定用户的偏好，但这种适应性也被用于非法目的，例如伪造公众人物的肖像、复制受版权保护的艺术作品和生成露骨内容。现有工作侧重于检测非法生成的内容，但无法阻止或减轻扩散模型的非法改编。同样，其他模型遗忘和重新初始化方案也无法阻止用户使用自定义数据重新学习非法模型改编的知识。在本文中，我们提出了 FreezeAsGuard，这是一种新技术，它解决了这些局限性，并能够不可逆地减轻扩散模型的非法改编。我们的方法是模型发布者选择性地冻结预训练扩散模型中对非法模型改编至关重要的张量，以减轻非法改编中微调模型的表示能力，同时最大限度地减少对其他合法改编的影响。在多个文本到图像应用领域的实验结果表明，与竞争性基线相比，FreezeAsGuard 在减轻非法模型改编方面具有 37% 的更强能力，同时对合法模型改编的影响小于 5%。源代码可在以下网址获取：https://github.com/pittisl/FreezeAsGuard。