LLM2D
基于潜在扩散模型的免训练音乐风格迁移方法
A Training-Free Approach for Music Style Transfer with Latent Diffusion Models
作者: Sooyoung Kim, Joonwoo Kwon, Heehwan Wang, Shinjae Yoo, Yuewei Lin, Jiook Cha
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15913v1

摘要

音乐风格迁移为个性化音乐生成提供了令人兴奋的可能性,但通常需要大量的训练或详细的文本描述。本文介绍了一种新颖的免训练方法,该方法利用预训练的潜在扩散模型 (LDM)。通过操纵 LDM 的自注意力特征,我们能够有效地将参考音乐的风格迁移到内容音乐上,而无需额外的训练。与现有方法相比,我们的方法实现了更优越的风格迁移和旋律保留效果。这项工作为个性化音乐生成开辟了新的创意途径。