摘要
arXiv:2309.13259v2 宣布类型: 替换交叉
摘要:EMelodyGen 系统专注于通过音乐特征模板控制在 ABC 符号表示下生成情感旋律。由于高质量、结构良好且带有情感标签的乐谱稀缺,我们设计了一个模板,通过从小规模的情感符号音乐数据集和音乐心理学结论中提取的音乐特征与情感标签之间的统计相关性来控制情感旋律的生成。然后,我们使用该模板自动标注了一个大规模、结构良好的乐谱集合,并用粗糙的情感标签标注了它们,将其转换为 ABC 符号表示,并通过数据增强减少了标签不平衡,最终得到了一个名为 Rough4Q 的数据集。基于 Rough4Q 预训练的系统骨干可以实现高达 99% 的 music21 解析率,而由模板生成的旋律能够在盲听测试中情感表达对齐度达到 91%。进一步的消融研究还验证了模板中特征控制的有效性。相关代码和演示可在 https://github.com/monetjoe/EMelodyGen 查看。