LLM2D

摘要

可控音乐生成在人机协同创作音乐中起着至关重要的作用。虽然大型语言模型 (LLM) 在生成高质量音乐方面展现出潜力，但它们对自回归生成的关注限制了其在音乐编辑任务中的效用。为了解决这一差距，我们提出了一种新方法，利用参数高效的异构适配器结合掩码训练方案。这种方法使自回归语言模型能够无缝地解决音乐修复任务。此外，我们的方法集成了帧级基于内容的控制，方便了曲目条件的音乐细化和谱面条件的音乐编排。我们将此方法应用于对 MusicGen 的微调，MusicGen 是一个领先的自回归音乐生成模型。我们的实验表明，在多个音乐编辑任务中取得了令人鼓舞的结果，为未来的 AI 驱动的音乐编辑工具提供了更灵活的控制。源代码和展示我们工作的演示页面可在 https://kikyo-16.github.io/AIR 获取。