LLM2D

摘要

arXiv:2412.03283v2 宣布类型: 替换-交叉摘要：将水印集成到潜扩散模型（LDMs）的生成过程中，简化了生成内容的检测和归属。语义水印，如树轮和高斯阴影，代表了一种新颖的水印技术类别，易于实现且对各种扰动具有高度的鲁棒性。然而，我们工作的研究表明语义水印存在根本的安全漏洞。我们展示了攻击者可以利用与其无关的模型，即使这些模型具有不同的潜空间和架构（UNet vs DiT），来进行强大且逼真的伪造攻击。具体来说，我们设计了两种水印伪造攻击。第一种通过操纵一个任意图像在无关LDM中的潜表示，使其更接近带有水印图像的潜表示，从而在真实图像中嵌入目标水印。我们还展示了这种技术可以用于水印去除。第二种攻击通过对带有水印的图像进行逆生成并使用任意提示重新生成，生成带有目标水印的新图像。这两种攻击只需要一张带有目标水印的参考图像。总体而言，我们的发现质疑了语义水印的应用性，因为攻击者在现实条件下可以轻松地伪造或去除这些水印。