LLM2D

摘要

arXiv:2402.00045v4 宣布类型: replace-cross 摘要：大型人工智能模型（LAIMs），尤其是扩散模型和大型语言模型的快速发展，标志着一个新的时代，即AI生成的多媒体越来越多地融入日常生活的各个方面。尽管在众多领域带来了好处，但这种内容也带来了重大风险，包括潜在的滥用、社会扰乱和伦理问题。因此，检测由LAIMs生成的多媒体变得至关重要，并且相关的研究也有了显著增长。然而，仍存在一个明显的系统性差距，即专注于检测LAIMs生成的多媒体的研究综述。为了解决这一问题，我们提供了第一份综述，全面涵盖了现有检测LAIMs生成的多媒体（如文本、图像、视频、音频和多媒体内容）的研究。具体而言，我们引入了一种新的分类法，按照媒体模态进行分类，并与两个视角相对应：纯检测（旨在提高检测性能）和超越检测（为检测器增加普遍性、稳健性和可解释性等属性）。此外，我们还简要介绍了生成机制、公共数据集、在线检测工具和评估指标，为该领域的研究人员和 practitioners 提供了有价值的资源。最重要的是，我们从社交媒体的角度进行了重点分析，以突出其更广泛的社会影响。此外，我们识别了检测当前面临的挑战，并提出了未来研究的方向，以解决检测LAIMs生成的多媒体过程中尚未探索、持续和新兴的问题。我们撰写此综述的目的是填补学术空白，并为全球AI安全努力作出贡献，帮助确保数字领域的信息完整。项目链接为 https://github.com/Purdue-M2/Detect-LAIM-generated-Multimedia-Survey。