LLM2D
音乐与音频的生成式人工智能
Generative AI for Music and Audio
作者: Hao-Wen Dong
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14627v1

摘要

生成式AI正在改变我们与技术互动和消费内容的方式。在未来十年,AI技术将重塑我们在各种媒体中创作音频内容的方式,包括音乐、戏剧、电影、游戏、播客和短视频。在本论文中,我介绍了围绕音乐和音频生成式AI的三个主要研究方向:1)多轨音乐生成,2)辅助音乐创作工具,以及3)音频和音乐的多模态学习。通过我的研究,我旨在回答以下两个基本问题:1)AI如何帮助专业人士或业余爱好者创作音乐和音频内容?2)AI能否像人类学习音乐一样学习创作音乐?我的长期目标是降低音乐创作的门槛,并使音频内容创作民主化。