摘要
arXiv:2505.09382v1 类型:跨领域研究
摘要:音色是指一个人的嗓音的独特品质或特性,这种品质或特性使其在人类听觉感知中与其他人的嗓音区分开来。2025年声音音色属性检测(VtaD)挑战专注于以对比的方式解释音色属性。在此次挑战中,人类对音色的印象通过一组感官描述符进行阐述,包括明亮、粗糙、柔软、磁性等。音色是从特定描述符维度内两个嗓音的强度对比中进行解释的。2025年声音音色属性检测挑战于5月开始,并将于2025年10月在江苏省镇江市举办的NCMMSC2025会议上 culminates 为一项特别提案。