LLM2D

摘要

arXiv:2402.00045v5 Announce Type: replace-cross 摘要：大型人工智能模型（LAIMs），特别是扩散模型和大型语言模型的快速进展，标志着一个新时代的到来，在这个时代，由AI生成的多媒体越来越多地融入日常生活的各个方面。尽管在许多领域都带来了好处，但这种内容也带来了重大风险，包括可能的滥用、社会动荡以及伦理问题。因此，检测由LAIMs生成的多媒体变得至关重要，相关研究也出现了显著增长。尽管如此，仍存在一个值得注意的研究空白，即专注于检测LAIMs生成的多媒体的系统性调查。为了应对这一问题，我们提供了第一个涵盖检测LAIMs生成的多媒体（如文本、图像、视频、音频和多模态内容）现有研究的综述。具体而言，我们引入了一种新的分类法，按媒体模式分类，并与两种视角对齐：纯粹的检测（旨在提高检测性能）和超越检测（为检测器添加通用性、鲁棒性和可解释性等属性）。此外，我们还简要介绍了生成机制、公共数据集、在线检测工具和评估指标，为该领域的研究人员和从业者提供有价值的资源。最重要的是，我们从社交媒体的角度进行了重点分析，以突出其更广泛的社会影响。此外，我们指出了检测中当前面临的挑战，并提出了应对未探索、正在进行和新兴问题的研究方向，以检测LAIMs生成的多媒体。我们此次综述旨在填补学术空白，为全球AI安全努力做出贡献，帮助确保数字领域的信息完整性。项目链接为https://github.com/Purdue-M2/Detect-LAIM-generated-Multimedia-Survey。