LLM2D
视觉反图灵测试 (VCT²): 揭示 AI 生成图像检测的挑战并引入视觉 AI 指数 (V_AI)
Visual Counter Turing Test (VCT^2): Discovering the Challenges for AI-Generated Image Detection and Introducing Visual AI Index (V_AI)
作者: Nasrin Imanpour, Shashwat Bajpai, Subhankar Ghosh, Sainath Reddy Sankepally, Abhilekh Borah, Hasnat Md Abdullah, Nishoak Kosaraju, Shreyas Dixit, Ashhar Aziz, Shwetangshu Biswas, Vinija Jain, Aman Chadha, Amit Sheth, Amitava Das
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2411.16754v1

摘要

随着人工智能图像生成技术的普及及其日益便捷的获取,人们对这些图像被滥用于传播虚假信息的能力表示严重关切。最近的人工智能生成图像检测 (AGID) 方法包括 CNNDetection、NPR、DM 图像检测、Fake Image Detection、DIRE、LASTED、GAN 图像检测、AIDE、SSP、DRCT、RINE、OCC-CLIP、De-Fake 和 Deep Fake Detection。然而,我们认为目前最先进的 AGID 技术不足以有效检测当代人工智能生成的图像,并主张对这些方法进行全面重新评估。我们引入了视觉反图灵测试 (VCT²),这是一个包含约 13 万张由当代文本到图像模型(Stable Diffusion 2.1、Stable Diffusion XL、Stable Diffusion 3、DALL-E 3 和 Midjourney 6)生成的图像的基准。VCT² 包含两组提示,这些提示来自《纽约时报》推特账号的推文和 MS COCO 数据集的标题。我们还在 VCT² 基准上评估了上述 AGID 技术的性能,突出了它们在检测人工智能生成图像方面的无效性。随着图像生成人工智能模型的不断发展,对评估这些模型的可量化框架的需求也日益迫切。为了满足这一需求,我们提出了视觉人工智能指数 (V_AI),它从各种视觉角度(包括纹理复杂性和对象连贯性)评估生成的图像,为评估图像生成人工智能模型设定了新的标准。为了促进该领域的研究,我们将我们的 https://huggingface.co/datasets/anonymous1233/COCO_AI 和 https://huggingface.co/datasets/anonymous1233/twitter_AI 数据集公开发布。