摘要
arXiv:2501.15877v2 通知类型: replace-cross
摘要:印度语言背景下对多样化和高质量的断句语音数据的需求日益增长。本文介绍了Project Boli项目,这是一个多语言断句语音数据集,旨在为口吃者及其技术发展提供科学理解和支持,特别是在印度。数据集包含以下内容:(a) 匿名的元数据(性别、年龄、国家、母语)以及关于口吃如何影响他们日常生活的问题问卷回答;(b) 每个参与者既包括使用彩虹段落进行的诵读语音记录,也包括通过图像描述任务收集的自发语音;(c) 包括详细的五个断句类型的注释:阻塞、延长、插入、音素重复和词重复。我们提供了对数据集的全面分析,包括数据收集过程、口吃者的生活经验总结、口吃事件严重程度评估以及收集数据的技术验证。该数据集作为开放访问发布,以促进语音技术的发展。