LLM2D

摘要

随着生成式人工智能技术的出现，数字图像操纵变得越来越容易和逼真。最近的发展允许进行文本引导的图像修复，使得用最少的努力就能进行复杂的图像编辑。这为数字媒体取证带来了新的挑战。例如，基于扩散模型的方法可以将修复区域拼接回原始图像，也可以重新生成整个图像。在后一种情况下，传统的图像伪造定位 (IFL) 方法通常会失效。本文介绍了文本引导图像修复伪造 (TGIF) 数据集，这是一个综合的图像集合，旨在支持图像伪造定位和合成图像检测 (SID) 方法的训练和评估。TGIF 数据集包含大约 75,000 张伪造图像，这些图像源自流行的开源和商业方法，即 SD2、SDXL 和 Adobe Firefly。我们在 TGIF 上对几种最先进的 IFL 和 SID 方法进行了基准测试。虽然传统的 IFL 方法可以检测拼接图像，但它们无法检测重新生成的修复图像。此外，传统的 SID 可能会检测到重新生成的修复图像为假，但无法定位修复区域。最后，IFL 和 SID 方法在遇到更强的压缩时都会失效，而它们对现代压缩算法（如 WEBP）的鲁棒性较差。总之，这项工作证明了最先进的检测器在现代生成方法执行的局部操作上的效率低下，并希望有助于开发更强大的 IFL 和 SID 方法。数据集和代码可以从 https://github.com/IDLabMedia/tgif-dataset 下载。