摘要
arXiv:2412.17632v2 宣布类型: 替换
摘要: 在人工智慧行成内容(AIGC)中,区分由人工智能合成的图像和自然图像仍然是一个关键挑战。尽管生成模型取得了进展,但仍然存在显著差异。为了系统地研究并量化这些差异,我们引入了一个针对关键问题的AI-自然图像差异访问基准(\textit{D-Judge}):\textit{人工智能生成的图像(AIGIs)与真正现实的图像相差多远?}我们构建了\textit{D-ANI}数据集,包含了5,000张自然图像和超过440,000张由九个模型生成的人工智能生成的图像(AIGIs),使用了文本到图像(T2I)、图像到图像(I2I)和文本和图像到图像(TI2I)的提示。我们的框架在五个维度上评估这些差异:朴素的图像质量、语义对齐、审美吸引力、下游适用性和人工验证。结果揭示了明显的差距,突出了与人类判断相一致的度量标准的重要性。源代码和数据集可在 https://shorturl.at/l83W2 获取。