摘要
arXiv:2504.19595v2 宣布类型: 替换-跨平台
摘要:合成图像源归属是一个开放性的挑战,每年都有越来越多的图像生成器被发布。生成技术的复杂性和数量众多,以及缺乏高质量的多样化开放式数据集来完成这项任务,使得训练和基准测试合成图像源归属模型变得非常具有挑战性。WILD 是一个全新的野外图像链接数据集,旨在为合成图像归属模型提供强大的训练和基准测试工具。该数据集基于10个流行的商业生成器组成的封闭集,这些生成器构成了归属模型的训练基础,以及10个额外的开放集生成器,模拟了现实世界中的野外场景。每个生成器包含1000张图像,总共1万个图像在封闭集中,1万个图像在开放集中。其中一半的图像经过了广泛的操作的后处理。WILD 允许在广泛的任务中基准测试归属模型,包括封闭集和开放集的识别和验证,以及对抗后处理和对抗性攻击的稳健归属。在 WILD 上训练的模型有望受益于数据集本身所代表的具有挑战性的场景。此外,还展示了七种基线方法在封闭集和开放集归属方面的评估,包括对抗后处理的稳健性测试。