LLM2D

摘要

在这项工作中，我们描述了我们提交给 2024 年语音隐私挑战赛的方案。我们没有提出一种新颖的语音匿名化系统，而是对提供的基线进行了改进，以满足所有要求的条件并改善评估指标。具体来说，我们实现了情感嵌入，并使用 WavLM 和 ECAPA2 说话人嵌入器对 B3 基线进行了实验。此外，我们比较了不同的说话人和韵律匿名化技术。此外，我们为 B5 引入了均值回归 F0，这有助于在不损失效用情况下提高隐私。最后，我们探索了分离模型，即 $\beta$-VAE 和 NaturalSpeech3 FACodec。