LLM2D

摘要

生成式AI正在改变我们与技术互动和消费内容的方式。在未来十年，AI技术将重塑我们在各种媒体中创作音频内容的方式，包括音乐、戏剧、电影、游戏、播客和短视频。在本论文中，我介绍了围绕音乐和音频生成式AI的三个主要研究方向：1）多轨音乐生成，2）辅助音乐创作工具，以及3）音频和音乐的多模态学习。通过我的研究，我旨在回答以下两个基本问题：1）AI如何帮助专业人士或业余爱好者创作音乐和音频内容？2）AI能否像人类学习音乐一样学习创作音乐？我的长期目标是降低音乐创作的门槛，并使音频内容创作民主化。