摘要
在这项工作中,我们描述了我们提交给 2024 年语音隐私挑战赛的方案。我们没有提出一种新颖的语音匿名化系统,而是对提供的基线进行了改进,以满足所有要求的条件并改善评估指标。具体来说,我们实现了情感嵌入,并使用 WavLM 和 ECAPA2 说话人嵌入器对 B3 基线进行了实验。此外,我们比较了不同的说话人和韵律匿名化技术。此外,我们为 B5 引入了均值回归 F0,这有助于在不损失效用情况下提高隐私。最后,我们探索了分离模型,即 $\beta$-VAE 和 NaturalSpeech3 FACodec。