LLM2D

摘要

在医疗保健中，人工智能决策的透明度至关重要，因为错误会带来严重后果，这对于在情感分析任务中建立人工智能与用户之间的信任至关重要。将推理能力纳入大型语言模型 (LLM) 有助于其理解更广泛语境中的人类情感，处理细微和含糊的语言，并推断可能未明确表达的潜在情感。在这项工作中，我们针对语音和文本两种模态引入了一项新任务——情感推理，并提出了我们提出的多模态多任务框架和数据集。我们的研究表明，基于推理的训练增强了模型在人类转录和自动语音识别 (ASR) 设置下的情感分类性能。此外，我们发现生成的推理通常表现出与人类生成的推理不同的词汇，但保持相似的语义。所有代码、数据（英语翻译和越南语）和模型已在线发布：https://github.com/leduckhai/MultiMed。