LLM2D
Home
Arxiv
返回列表
开发用于奥吉伯韦、米克马克和马里斯特语言的多语言语音合成系统
Developing multilingual speech synthesis system for Ojibwe, Mi'kmaq, and Maliseet
作者:
Shenran Wang, Changbing Yang, Mike Parkhill, Chad Quinn, Christopher Hammerly, Jian Zhu
发布日期:
2/6/2025
arXiv ID:
oai:arXiv.org:2502.02703v1
摘要
arXiv:2502.02703v1 论文类型: cross 摘要: 我们介绍了针对北美三种原住民语言奥吉贝瓦语、米克马克语和马里斯特语的轻量化流匹配多语言文本-to-语音(TTS)系统。我们的结果显示,在三种类型学相似的语言上训练多语言TTS模型可以提高性能,尤其是在数据稀缺的情况下。无注意力架构在内存效率方面与自我注意力架构竞争激烈。我们的研究不仅推动了低资源语言复原的技术开发,还突显了人类评估协议中的文化差距,呼吁采取更加以社区为中心的人类评估方法。
查看原文
下载 PDF