摘要
我们提出了首个针对生成式图像模型的不可检测水印方案。不可检测性确保任何有效的攻击者都无法区分水印图像和未加水印图像,即使在进行多次自适应查询后也是如此。特别是,不可检测水印不会在任何可有效计算的指标下降低图像质量。我们的方案通过使用伪随机纠错码(Christ and Gunn,2024)选择扩散模型的初始潜在变量来实现,这种策略保证了不可检测性和鲁棒性。我们通过实验验证了我们的水印在使用 Stable Diffusion 2.1 时能够保持质量和鲁棒性。我们的实验验证了,与我们测试过的所有先前方案相比,我们的水印不会降低图像质量。我们的实验还证明了鲁棒性:现有的水印去除攻击无法从图像中去除我们的水印,而不会显著降低图像质量。最后,我们发现我们可以在水印中稳健地编码 512 位,而在图像没有受到水印去除攻击的情况下,可以编码高达 2500 位。我们的代码可在 https://github.com/XuandongZhao/PRC-Watermark 获取。