LLM2D

摘要

arXiv:2504.07521v2 通报类型:替换摘要：现有的大多数情感分析侧重于识别产生了哪种情绪（例如，高兴、悲伤、愤怒），但忽视了更深层次的why。我们提出了情感解释（EI），注重情绪反应背后的原因——这些原因可能是显性的（例如，可观察的物体、人际互动）或隐性的（例如，文化背景、不在画面中的事件）。与传统的 emotion 识别不同，EI 任务需要推理触发因素而非仅仅贴标签。为了促进 EI 研究，我们提出了 EIBench，这是一个大规模基准，包括 1,615 个基本 EI 样本和 50 个多维度情感的复杂 EI 样本。每个示例都要求基于推理的解释，而不是简单的分类。我们进一步提出了粗到细自我提问（CFSA）注释管道，该管道通过迭代的问题-答案环节引导视觉-语言模型（VLLMs），以大规模生成高质量的标签。在四种实验设置下对开源和专有大型语言模型进行广泛评估，揭示了在更复杂的情景下普遍存在性能差距，突显了 EI 对丰富同理心、情境感知 AI 应用的潜在价值。我们的基准和方法在 https://github.com/Lum1104/EIBench 公开可用，为先进的多模态因果分析和下一代情感计算提供了基础。