摘要
arXiv:2402.00045v5 Announce Type: replace-cross
摘要:大型人工智能模型(LAIMs),特别是扩散模型和大型语言模型的快速进展,标志着一个新时代的到来,在这个时代,由AI生成的多媒体越来越多地融入日常生活的各个方面。尽管在许多领域都带来了好处,但这种内容也带来了重大风险,包括可能的滥用、社会动荡以及伦理问题。因此,检测由LAIMs生成的多媒体变得至关重要,相关研究也出现了显著增长。尽管如此,仍存在一个值得注意的研究空白,即专注于检测LAIMs生成的多媒体的系统性调查。为了应对这一问题,我们提供了第一个涵盖检测LAIMs生成的多媒体(如文本、图像、视频、音频和多模态内容)现有研究的综述。具体而言,我们引入了一种新的分类法,按媒体模式分类,并与两种视角对齐:纯粹的检测(旨在提高检测性能)和超越检测(为检测器添加通用性、鲁棒性和可解释性等属性)。此外,我们还简要介绍了生成机制、公共数据集、在线检测工具和评估指标,为该领域的研究人员和从业者提供有价值的资源。最重要的是,我们从社交媒体的角度进行了重点分析,以突出其更广泛的社会影响。此外,我们指出了检测中当前面临的挑战,并提出了应对未探索、正在进行和新兴问题的研究方向,以检测LAIMs生成的多媒体。我们此次综述旨在填补学术空白,为全球AI安全努力做出贡献,帮助确保数字领域的信息完整性。项目链接为https://github.com/Purdue-M2/Detect-LAIM-generated-Multimedia-Survey。