摘要
arXiv:2503.19176v1 声纹认证类型:跨领域
摘要:音频水印越来越多地用于验证人工智能生成内容的来源,从而实现诸如检测人工智能生成的声音、保护音乐IP和防范声音 cloned 的应用。为了有效,音频水印必须抵御那些通过改变认证信号以逃避检测的去除攻击。虽然许多方案声称具有鲁棒性,但这些声明通常是在孤立条件下测试,并且仅针对少量攻击。缺乏系统性的针对多种去除攻击的评估,阻碍了实际部署。在本文中,我们探讨了那些声称具有鲁棒性的最新音频水印方案是否能够抵御广泛范围的去除攻击。首先,我们引入了一种涵盖22种音频水印方案的分类体系。接着,我们总结了这些方案的底层技术及其潜在漏洞。然后,我们进行了一项大规模的实际研究,以评估其鲁棒性。为了支持这一研究,我们构建了一个包含22种类型去除攻击(109种配置)的评估框架,包括信号级别、物理级别和人工智能引发的改。我们使用开源代码复现了9种水印方案,发现了8种新的高效去除攻击,并突出了11项关键发现,这些发现揭示了这些方法在3个公开数据集上的根本局限。研究结果表明,调查的方案都无法抵御所有测试的畸变。这项评估提供了当前水印方法在现实威胁下的综合表现视图。我们的演示和代码可在 https://sokaudiowm.github.io/ 获取。