摘要
arXiv:2402.00045v4 宣布类型: replace-cross
摘要:大型人工智能模型(LAIMs),尤其是扩散模型和大型语言模型的快速发展,标志着一个新的时代,即AI生成的多媒体越来越多地融入日常生活的各个方面。尽管在众多领域带来了好处,但这种内容也带来了重大风险,包括潜在的滥用、社会扰乱和伦理问题。因此,检测由LAIMs生成的多媒体变得至关重要,并且相关的研究也有了显著增长。然而,仍存在一个明显的系统性差距,即专注于检测LAIMs生成的多媒体的研究综述。为了解决这一问题,我们提供了第一份综述,全面涵盖了现有检测LAIMs生成的多媒体(如文本、图像、视频、音频和多媒体内容)的研究。具体而言,我们引入了一种新的分类法,按照媒体模态进行分类,并与两个视角相对应:纯检测(旨在提高检测性能)和超越检测(为检测器增加普遍性、稳健性和可解释性等属性)。此外,我们还简要介绍了生成机制、公共数据集、在线检测工具和评估指标,为该领域的研究人员和 practitioners 提供了有价值的资源。最重要的是,我们从社交媒体的角度进行了重点分析,以突出其更广泛的社会影响。此外,我们识别了检测当前面临的挑战,并提出了未来研究的方向,以解决检测LAIMs生成的多媒体过程中尚未探索、持续和新兴的问题。我们撰写此综述的目的是填补学术空白,并为全球AI安全努力作出贡献,帮助确保数字领域的信息完整。项目链接为 https://github.com/Purdue-M2/Detect-LAIM-generated-Multimedia-Survey。