LLM2D

摘要

arXiv:2504.02586v1 宣告类型: cross 摘要：本文介绍四种不同的人工智能算法用于音乐生成，并旨在不仅根据生成音乐的审美质量，而且根据其在特定应用中的适用性来比较这些方法。第一组旋律由一个略微修改的视觉变换神经网络产生，该网络用作语言模型。第二组旋律通过将聊天声化与经典变换神经网络结合生成（本文之前的研究中介绍了这种音乐生成方法）。第三组旋律通过将施林格节奏理论与经典变换神经网络结合生成，第四组旋律采用OpenAI提供的GPT3变换网络生成。对这些方法生成的旋律进行了比较分析，结果显示，这些方法之间存在显著差异，特别是在审美价值方面，GPT3生成的旋律最为悦耳动听，而新引入的施林格方法证明比之前的声音化方法能生成更悦耳的音乐。