LLM2D
2025年声音音色属性检测挑战评估计划
The Voice Timbre Attribute Detection 2025 Challenge Evaluation Plan
作者: Zhengyan Sheng, Jinghao He, Liping Chen, Kong Aik Lee, Zhen-Hua Ling
发布日期: 5/15/2025
arXiv ID: oai:arXiv.org:2505.09382v1

摘要

arXiv:2505.09382v1 类型:跨领域研究 摘要:音色是指一个人的嗓音的独特品质或特性,这种品质或特性使其在人类听觉感知中与其他人的嗓音区分开来。2025年声音音色属性检测(VtaD)挑战专注于以对比的方式解释音色属性。在此次挑战中,人类对音色的印象通过一组感官描述符进行阐述,包括明亮、粗糙、柔软、磁性等。音色是从特定描述符维度内两个嗓音的强度对比中进行解释的。2025年声音音色属性检测挑战于5月开始,并将于2025年10月在江苏省镇江市举办的NCMMSC2025会议上 culminates 为一项特别提案。