LLM2D
感知度量对音乐表征学习在流派分类中的影响
The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification
作者: Tashi Namgyal, Alexander Hepburn, Raul Santos-Rodriguez, Valero Laparra, Jesus Malo
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.17069v1

摘要

自然信号的主观质量可以用客观感知度量来近似。感知度量旨在近似人类观察者的感知行为,通常反映自然信号和神经通路中的结构。使用感知度量作为损失函数训练的模型可以从这些度量中包含的结构中捕捉到感知上有意义的特征。我们证明,使用从使用感知损失训练的自动编码器中提取的特征,可以提高音乐理解任务(例如,流派分类)的性能,优于直接使用这些度量作为距离来学习分类器。这一结果表明,在使用感知度量作为表示学习的损失函数时,对新信号的泛化能力有所提高。