LLM2D

摘要

arXiv:2502.04522v3 宣布类型: replace-cross 摘要：尽管深度学习在各种领域实现了风格转换的显著进展，但在完整符号表示的音乐作品中生成可控制的性能级别音乐风格转换仍然是一个具有挑战性的研究领域。这主要是由于数据集有限，尤其是在爵士等流派方面，以及缺乏能够处理多种音乐生成任务的统一模型。本文提出了一种基于变换器的架构—ImprovNet，通过自我监督的污染-精炼训练策略生成具有表现性和可控制性的音乐即兴创作。这种即兴风格转换旨在对原始作品的一个或多个音乐元素（旋律、和声或节奏）进行有针对性的修改，以符合目标流派。ImprovNet 统一了多种能力于单一模型中：它可以进行跨流派和同一流派的即兴创作，根据特定流派风格对旋律进行和声化，并执行短提示继续和填补任务。模型的迭代生成框架允许用户控制风格转换和结构相似性的程度。客观和主观评估表明，ImprovNet 在生成音乐连贯的即兴创作方面有效，同时保持与原始作品的结构关系。在短续写和填补任务中，该模型优于预期音乐变换器，并成功实现了可识别的流派转换，其中79%的参与者能够正确识别出古典作品的爵士风格即兴创作。我们的代码和演示页面可以在 https://github.com/keshavbhandari/improvnet 查看。