LLM2D
钢琴音质的全面评价
A Holistic Evaluation of Piano Sound Quality
作者: Monan Zhou, Shangda Wu, Shaohua Ji, Zijin Li, Wei Li
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2310.04722v2

摘要

arXiv:2310.04722v2 公告类型: 替换-交叉 摘要:本文旨在开发一种全方位的钢琴音质评估方法,以帮助购买决策。与以往研究主要关注钢琴演奏技巧对音质的影响不同,本研究评估的是不同钢琴的固有音质。为了得出质量评估体系,研究使用基于钢琴音质数据集的主观问卷。该方法通过比较不同预训练模型的卷积神经网络(CNN)微调结果,选择最佳的钢琴分类模型。为了提高模型的可解释性,研究应用了等效矩形带宽(ERB)分析。结果表明,音乐训练的个体更能区分不同钢琴音质的差异。最佳预训练的微调CNN主干作为钢琴分类器实现了98.3%的高准确性。然而,数据集有限,音频被切割以增加数量,导致缺乏多样性和平衡性,因此我们使用焦点损失来减轻数据不平衡的影响。为了优化该方法,未来研究将扩展数据集或采用少样本学习技术。