LLM2D
从方言差距到身份映射:应对说话人验证中的变异性
From Dialect Gaps to Identity Maps: Tackling Variability in Speaker Verification
作者: Abdulhady Abas Abdullah, Soran Badawi, Dana A. Abdullah, Dana Rasul Hamad, Hanan Abdulrahman Taher, Sabat Salih Muhamad, Aram Mahmood Ahmed, Bryar A. Hassan, Sirwan Abdolwahed Aula, Tarik A. Rashid
发布日期: 5/9/2025
arXiv ID: oai:arXiv.org:2505.04629v1

摘要

arXiv:2505.04629v1 交叉公告类型:cross 摘要:本文探讨了在多名族方言中识别库尔德语讲者所面临的复杂性和困难。由于库尔德语及其多种方言(包括库尔曼济、索拉尼和哈瓦拉米)在音韵和词汇上的巨大差异,这为语音识别系统带来了特殊的挑战。本文研究了构建能够准确识别多名族方言中讲者的强大语音识别系统的难点。为了提高这些系统的准确性和可靠性,本文还提出了一些解决方案,如复杂的机器学习方法、数据扩增策略以及构建详细的方言特定语料库。结果表明,为每个方言量身定制的策略与跨方言训练大大提高了识别性能。