LLM2D
SOLIDO:基于低秩适应的稳健语音合成水印方法
SOLIDO: A Robust Watermarking Method for Speech Synthesis via Low-Rank Adaptation
作者: Yue Li, Weizhi Liu, Dongdong Lin
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.15035v1

摘要

arXiv:2504.15035v1 安全公告类型: 交叉 摘要: 语音生成模型的加速发展导致了安全问题,包括模型侵权和未经授权对内容的滥用。尽管现有的生成水印技术已经提出了相应的解决方案,但大多数方法都需要大量的计算开销和训练成本。此外,一些方法在处理变长输入时在鲁棒性方面存在限制。为了解决这些问题,我们提出了一种名为SOLIDO的新型生成水印方法,该方法通过低秩适应(LoRA)将参数高效的微调与语音水印技术结合到语音扩散模型中。具体而言,水印编码器将水印转换为与扩散模型输入对齐。为了从变长输入中精确提取水印,基于深度可分离卷积的水印解码器被设计用来恢复水印。为了进一步提高语音生成性能和水印提取能力,我们提出了一种基于语音驱动的轻量级微调策略,通过LoRA减少计算开销。全面的实验结果表明,所提出的方法即使在2000 bps的大容量下也能确保高保真度的带水印语音。此外,针对常见的单一语音攻击和复合语音攻击,我们的SOLIDO分别实现了99.20%和98.43%的最高平均提取准确率。与最新的方法相比,在抵抗时间拉伸攻击方面,其性能几乎高出23%。