LLM2D

摘要

arXiv:2502.07461v1 交叉公告类型摘要：我们介绍了一个名为JamendoMaxCaps的大型音乐-描述数据集，该数据集包含来自知名Jamendo平台的超过200,000条免费许可的乐器曲目。此数据集包含由最先进的描述模型生成的描述，并附有补充的元数据信息。我们还介绍了一个检索系统，该系统利用音乐特征和元数据来识别相似的歌曲，然后使用局部大型语言模型（LLLM）填充缺失的元数据。这种方法使研究人员能够在音乐-语言理解任务中提供更全面和有信息量的数据集。我们通过五种不同的测量方法对其进行了定量验证。通过将JamendoMaxCaps数据集公开，我们提供了一个高质量的资源，以促进音乐-语言理解任务如音乐检索、多模态表示学习和生成音乐模型的研究。