摘要
arXiv:2502.07328v2 类别: 交叉学科
摘要:音乐-语言模型的出现极大地提升了AI系统的自动音乐生成能力,但它们在涵盖世界音乐流派和文化方面也受到了限制。我们对音乐生成的数据库和研究论文进行了研究,并量化了流派的偏差和不足。我们发现,现有音乐数据集中只有5.7%的时间来自非西方流派,这自然会导致模型在不同流派上的表现差异。然后我们调查了参数高效微调(PEFT)技术在缓解这一偏差方面的有效性。针对两种未充分代表的非西方音乐传统——印度传统古典音乐和土耳其 makam 音乐,我们使用两种流行模型——MusicGen 和 Mustango 的实验突显了跨流派通过小数据集适应音乐的潜力及其非平凡性,暗示了设计用于跨文化转移学习的更公平的基础音乐-语言模型的必要性。