LLM2D

摘要

arXiv:2503.20290v1 声音质量评估类型：交叉摘要：本文通过利用自然语言描述探索了声音质量评估的新视角，提供了比传统数值评分方法更为丰富、细腻的洞察。自然语言反馈提供了有指导性的建议和详细的评估，然而现有的数据集缺乏实现这一方法所需的全面注释。为弥补这一差距，我们引入了QualiSpeech，这是一个涵盖11个关键方面并包含详细自然语言评论（包括推理和上下文洞察）的全面性低级声音质量评估数据集。此外，我们提出QualiSpeech基准来评估听觉大语言模型（LLMs）的低级声音理解能力。实验结果表明，微调后的听觉LLMs可以可靠地生成详细的噪声和失真描述，有效识别其类型和时间特征。结果进一步强调了纳入推理以提高质量和评估准确性和可靠性的潜力。该数据集将在https://huggingface.co/datasets/tsinghua-ee/QualiSpeech发布。