LLM2D

摘要

量化音乐AI模型表示并使其与人类行为保持一致是音乐信息检索(MIR)领域的一个重要挑战。本文提出一个平台，用于探索AI音乐模型表示与人类音乐判断之间的直接比对(DAIRHuM)。该平台旨在使音乐家和实验者能够在一个音乐录音数据集中标记相似性，并使用定量分数和可视化图表检查预训练模型与其标签的一致性。DAIRHuM被用于分析NSynth表示与两位打击乐手在卡纳提克四重奏乐团中演奏的节奏二重奏之间的一致性，这是一个注释数据稀缺且评估一致性并非易事类型的音乐示例。结果证明了模型与人类对节奏和谐的判断之间存在显著的一致性，同时突出了卡纳提克音乐中节奏感知和音乐相似性判断的关键差异。这项工作是首批使⽤户能够探索卡纳提克音乐中⼈与AI模型⼀致性、推进印度音乐MIR研究（同时处理数据稀缺和文化特异性）的努力之⼀。该平台的开发为代表性不足的音乐类型提供了更易访问的音乐AI工具。