LLM2D

摘要

arXiv:2501.15877v2 通知类型: replace-cross 摘要：印度语言背景下对多样化和高质量的断句语音数据的需求日益增长。本文介绍了Project Boli项目，这是一个多语言断句语音数据集，旨在为口吃者及其技术发展提供科学理解和支持，特别是在印度。数据集包含以下内容：(a) 匿名的元数据（性别、年龄、国家、母语）以及关于口吃如何影响他们日常生活的问题问卷回答；(b) 每个参与者既包括使用彩虹段落进行的诵读语音记录，也包括通过图像描述任务收集的自发语音；(c) 包括详细的五个断句类型的注释：阻塞、延长、插入、音素重复和词重复。我们提供了对数据集的全面分析，包括数据收集过程、口吃者的生活经验总结、口吃事件严重程度评估以及收集数据的技术验证。该数据集作为开放访问发布，以促进语音技术的发展。