LLM2D

摘要

arXiv:2406.04906v3 生成类型：replace-cross 摘要：近期生成型人工智能模型在生成真实且类人内容方面的能力，正在显著改变人们的沟通方式、创作方式和工作方式。机器生成的内容是一把双刃剑。一方面，如果使用得当，它可以造福社会。另一方面，它也可能误导人们，对社会构成威胁，尤其是在与人类创作的自然内容混合时。因此，开发有效的检测机器生成内容的方法变得十分迫切。然而，缺乏对齐的多模态数据集限制了此类方法的发展，特别是在三模态设置（例如，文本、图像和语音）中。在本文中，我们引入了RU-AI，一种新的大规模多模态数据集，用于在文本、图像和语音中对机器生成内容进行稳健和有效的检测。我们的数据集基于三个大型公共可用数据集：Flickr8K、COCO 和 Places205 构建，并添加了相应的AI副本，总共包括1,475,370个实例。此外，我们还创建了一个额外的数据集变体以测试检测模型的鲁棒性。我们在我们的数据集上使用当前的SOTA检测方法进行了广泛的实验。结果显示，现有的模型在我们的数据集上仍难以实现准确和稳健的检测。我们希望这个新的数据集能够促进机器生成内容检测领域的研究，促进生成型人工智能的负责任使用。源代码和数据集可在 https://github.com/ZhihaoZhang97/RU-AI 获取。