LLM2D
2024 年语音隐私挑战赛:NTU-NPU 系统
NTU-NPU System for Voice Privacy 2024 Challenge
作者: Nikita Kuzmin, Hieu-Thi Luong, Jixun Yao, Lei Xie, Kong Aik Lee, Eng Siong Chng
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2410.02371v1

摘要

在这项工作中,我们描述了我们提交给 2024 年语音隐私挑战赛的方案。我们没有提出一种新颖的语音匿名化系统,而是对提供的基线进行了改进,以满足所有要求的条件并改善评估指标。具体来说,我们实现了情感嵌入,并使用 WavLM 和 ECAPA2 说话人嵌入器对 B3 基线进行了实验。此外,我们比较了不同的说话人和韵律匿名化技术。此外,我们为 B5 引入了均值回归 F0,这有助于在不损失效用情况下提高隐私。最后,我们探索了分离模型,即 $\beta$-VAE 和 NaturalSpeech3 FACodec。