LLM2D
Home
Arxiv
返回列表
语音克隆:综述调研
Voice Cloning: Comprehensive Survey
作者:
Hussam Azzuni, Abdulmotaleb El Saddik
发布日期:
5/2/2025
arXiv ID:
oai:arXiv.org:2505.00579v1
摘要
arXiv:2505.00579v1 交叉类型公告: 摘要:语音克隆在当今的数字世界中迅速发展,许多研究人员和公司致力于改进这些算法以应用于各种领域。本文旨在建立语音克隆的标准术语,并探讨其不同的变体。文章将介绍说话人适配作为基本概念,然后深入探讨在该背景下的话题,如少样本、零样本和多语言TTS。最后,我们将探讨语音克隆研究中常用的研究评价指标及相关数据集。这篇综述汇总了现有的语音克隆算法,以促进对其生成和检测的研究,以限制其被误用。
查看原文
下载 PDF