摘要
随着人工智能图像生成技术的普及及其日益便捷的获取,人们对这些图像被滥用于传播虚假信息的能力表示严重关切。最近的人工智能生成图像检测 (AGID) 方法包括 CNNDetection、NPR、DM 图像检测、Fake Image Detection、DIRE、LASTED、GAN 图像检测、AIDE、SSP、DRCT、RINE、OCC-CLIP、De-Fake 和 Deep Fake Detection。然而,我们认为目前最先进的 AGID 技术不足以有效检测当代人工智能生成的图像,并主张对这些方法进行全面重新评估。我们引入了视觉反图灵测试 (VCT²),这是一个包含约 13 万张由当代文本到图像模型(Stable Diffusion 2.1、Stable Diffusion XL、Stable Diffusion 3、DALL-E 3 和 Midjourney 6)生成的图像的基准。VCT² 包含两组提示,这些提示来自《纽约时报》推特账号的推文和 MS COCO 数据集的标题。我们还在 VCT² 基准上评估了上述 AGID 技术的性能,突出了它们在检测人工智能生成图像方面的无效性。随着图像生成人工智能模型的不断发展,对评估这些模型的可量化框架的需求也日益迫切。为了满足这一需求,我们提出了视觉人工智能指数 (V_AI),它从各种视觉角度(包括纹理复杂性和对象连贯性)评估生成的图像,为评估图像生成人工智能模型设定了新的标准。为了促进该领域的研究,我们将我们的 https://huggingface.co/datasets/anonymous1233/COCO_AI 和 https://huggingface.co/datasets/anonymous1233/twitter_AI 数据集公开发布。