LLM2D
音乐属于所有人:探索音乐生成模型中的多文化表现
Music for All: Exploring Multicultural Representations in Music Generation Models
作者: Atharva Mehta, Shivam Chauhan, Amirbek Djanibekov, Atharva Kulkarni, Gus Xia, Monojit Choudhury
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.07328v2

摘要

arXiv:2502.07328v2 类别: 交叉学科 摘要:音乐-语言模型的出现极大地提升了AI系统的自动音乐生成能力,但它们在涵盖世界音乐流派和文化方面也受到了限制。我们对音乐生成的数据库和研究论文进行了研究,并量化了流派的偏差和不足。我们发现,现有音乐数据集中只有5.7%的时间来自非西方流派,这自然会导致模型在不同流派上的表现差异。然后我们调查了参数高效微调(PEFT)技术在缓解这一偏差方面的有效性。针对两种未充分代表的非西方音乐传统——印度传统古典音乐和土耳其 makam 音乐,我们使用两种流行模型——MusicGen 和 Mustango 的实验突显了跨流派通过小数据集适应音乐的潜力及其非平凡性,暗示了设计用于跨文化转移学习的更公平的基础音乐-语言模型的必要性。