LLM2D

摘要

arXiv:2505.04419v1 宣布类型：交叉摘要：装饰、装饰或微调音是许多音乐传统中旋律表达的要素，为表演增添了深度、细腻和情感冲击力。识别歌唱声音中的装饰在MIR中至关重要，潜在的应用包括音乐教学、歌手识别、音乐体裁分类以及受控歌唱声音生成。然而，缺乏标注数据集和专门的建模方法仍然是该研究领域进展的主要障碍。在这项工作中，我们介绍了Rāga装饰检测（ROD），一个由专家音乐家策划的印度古典音乐录音组成的新型数据集。该数据集使用定制的人工智能辅助工具对六大嗓音装饰进行事件标记的标注。使用此数据集，我们开发了一种基于深度时间序列分析的装饰检测模型，在长时间录音分块时保留装饰边界。我们在ROD数据集的不同训练-测试配置下进行实验，并在另一个由手工标注的印度古典音乐会录音组成的独立数据集上评估我们的方法。我们的实验结果支持我们提出的这种方法优于基准CRNN的方法。