LLM2D
BadVideo:针对文本生成视频的隐蔽后门攻击
BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation
作者: Ruotong Wang, Mingli Zhu, Jiarong Ou, Rui Chen, Xin Tao, Pengfei Wan, Baoyuan Wu
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2504.16907v1

摘要

arXiv:2504.16907v1 宣告类型: cross 摘要: 文本转视频(T2V)生成模型已经取得了快速进展,并在娱乐、教育和市场营销等多个领域得到了广泛应用。然而,这些模型的对抗性脆弱性却很少被研究。我们观察到,在T2V生成任务中,生成的视频往往包含大量未在文本提示中明确指定的冗余信息,如环境元素、次要对象和额外细节,这些信息为恶意攻击者提供了嵌入隐藏有害内容的机会。利用这些固有的冗余性,我们提出了BadVideo,这是首个针对T2V生成的后门攻击框架。我们的攻击集中在设计目标对抗输出的两个关键策略上:(1) 空间-时间组成,通过结合不同的空间-时间特征来编码恶意信息;(2) 动态元素转换,通过在冗余元素的时间变化中引入变换来传达恶意信息。基于这些策略,攻击者的恶意目标可以无缝融入用户的文本指令,提供高隐蔽性。此外,通过利用视频的时间维度,我们的攻击成功地规避了主要分析单个帧内空间信息的传统内容审查系统。广泛实验表明,BadVideo在保持原始语义和在干净输入上维持出色性能的同时,实现了高攻击成功率。总体而言,我们的工作揭示了T2V模型的对抗性脆弱性,提醒人们注意潜在的风险和误用。我们的项目页面位于 https://wrt2000.github.io/BadVideo2025/。