LLM2D

摘要

arXiv:2504.15035v1 安全公告类型: 交叉摘要: 语音生成模型的加速发展导致了安全问题，包括模型侵权和未经授权对内容的滥用。尽管现有的生成水印技术已经提出了相应的解决方案，但大多数方法都需要大量的计算开销和训练成本。此外，一些方法在处理变长输入时在鲁棒性方面存在限制。为了解决这些问题，我们提出了一种名为SOLIDO的新型生成水印方法，该方法通过低秩适应（LoRA）将参数高效的微调与语音水印技术结合到语音扩散模型中。具体而言，水印编码器将水印转换为与扩散模型输入对齐。为了从变长输入中精确提取水印，基于深度可分离卷积的水印解码器被设计用来恢复水印。为了进一步提高语音生成性能和水印提取能力，我们提出了一种基于语音驱动的轻量级微调策略，通过LoRA减少计算开销。全面的实验结果表明，所提出的方法即使在2000 bps的大容量下也能确保高保真度的带水印语音。此外，针对常见的单一语音攻击和复合语音攻击，我们的SOLIDO分别实现了99.20%和98.43%的最高平均提取准确率。与最新的方法相比，在抵抗时间拉伸攻击方面，其性能几乎高出23%。