LLM2D
音乐属于所有人:探索音乐生成模型中的多元文化表现(Camera Ready)
Music for All: Exploring Multicultural Representations in Music Generation Models (Camera Ready)
作者: Atharva Mehta, Shivam Chauhan, Amirbek Djanibekov, Atharva Kulkarni, Gus Xia, Monojit Choudhury
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.07328v1

摘要

arXiv:2502.07328v1 交叉公告类型 摘要:音乐语言模型的出现极大地提升了人工智能系统的自动音乐生成能力,但也限制了其对世界各地音乐流派和文化的覆盖面。我们对音乐生成的数据集和研究论文进行了研究,并量化了流派的偏差和过度代表问题。我们发现,现有音乐数据集中仅有5.7%的时间来自非西方流派,这自然导致了模型在不同流派上的表现不一。随后,我们研究了参数高效调优(PEFT)技术在减轻这种偏差方面的有效性。我们对两种流行模型 - MusicGen 和 Mustango 进行的实验,针对两种未充分代表的非西方音乐传统 - 印度古典音乐(Hindustani Classical)和土耳其麦卡穆音乐(Turkish Makam),突显了通过小数据集跨流派音乐适应的可能性及其非平凡性,这暗示了需要更多公平的基础音乐语言模型,这些模型旨在促进跨文化迁移学习的需要。