摘要
arXiv:2502.07461v1 交叉公告类型
摘要:我们介绍了一个名为JamendoMaxCaps的大型音乐-描述数据集,该数据集包含来自知名Jamendo平台的超过200,000条免费许可的乐器曲目。此数据集包含由最先进的描述模型生成的描述,并附有补充的元数据信息。我们还介绍了一个检索系统,该系统利用音乐特征和元数据来识别相似的歌曲,然后使用局部大型语言模型(LLLM)填充缺失的元数据。这种方法使研究人员能够在音乐-语言理解任务中提供更全面和有信息量的数据集。我们通过五种不同的测量方法对其进行了定量验证。通过将JamendoMaxCaps数据集公开,我们提供了一个高质量的资源,以促进音乐-语言理解任务如音乐检索、多模态表示学习和生成音乐模型的研究。