摘要
arXiv:2406.04906v3 生成类型:replace-cross
摘要:近期生成型人工智能模型在生成真实且类人内容方面的能力,正在显著改变人们的沟通方式、创作方式和工作方式。机器生成的内容是一把双刃剑。一方面,如果使用得当,它可以造福社会。另一方面,它也可能误导人们,对社会构成威胁,尤其是在与人类创作的自然内容混合时。因此,开发有效的检测机器生成内容的方法变得十分迫切。然而,缺乏对齐的多模态数据集限制了此类方法的发展,特别是在三模态设置(例如,文本、图像和语音)中。在本文中,我们引入了RU-AI,一种新的大规模多模态数据集,用于在文本、图像和语音中对机器生成内容进行稳健和有效的检测。我们的数据集基于三个大型公共可用数据集:Flickr8K、COCO 和 Places205 构建,并添加了相应的AI副本,总共包括1,475,370个实例。此外,我们还创建了一个额外的数据集变体以测试检测模型的鲁棒性。我们在我们的数据集上使用当前的SOTA检测方法进行了广泛的实验。结果显示,现有的模型在我们的数据集上仍难以实现准确和稳健的检测。我们希望这个新的数据集能够促进机器生成内容检测领域的研究,促进生成型人工智能的负责任使用。源代码和数据集可在 https://github.com/ZhihaoZhang97/RU-AI 获取。