LLM2D
JamendoMaxCaps:一个包含嵌入元数据的大规模音乐配文数据集
JamendoMaxCaps: A Large Scale Music-caption Dataset with Imputed Metadata
作者: Abhinaba Roy, Renhang Liu, Tongyu Lu, Dorien Herremans
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.07461v1

摘要

arXiv:2502.07461v1 交叉公告类型 摘要:我们介绍了一个名为JamendoMaxCaps的大型音乐-描述数据集,该数据集包含来自知名Jamendo平台的超过200,000条免费许可的乐器曲目。此数据集包含由最先进的描述模型生成的描述,并附有补充的元数据信息。我们还介绍了一个检索系统,该系统利用音乐特征和元数据来识别相似的歌曲,然后使用局部大型语言模型(LLLM)填充缺失的元数据。这种方法使研究人员能够在音乐-语言理解任务中提供更全面和有信息量的数据集。我们通过五种不同的测量方法对其进行了定量验证。通过将JamendoMaxCaps数据集公开,我们提供了一个高质量的资源,以促进音乐-语言理解任务如音乐检索、多模态表示学习和生成音乐模型的研究。