LLM2D
情绪识别与生成:面向、语音和文本模态的综述
Emotion Recognition and Generation: A Comprehensive Review of Face, Speech, and Text Modalities
作者: Rebecca Mobbs, Dimitrios Makris, Vasileios Argyriou
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.06803v1

摘要

arXiv:2502.06803v1 交叉公告类型 摘要:情绪识别与生成已成为人工智能研究中的关键议题,在医疗保健、客户服务等领域增强人机交互方面发挥着重要作用。尽管已经对情绪识别和生成分别进行了多项综述,但其中许多工作要么碎片化,要么局限于特定的方法论,缺乏对不同模态近期发展和趋势的全面概述。在这篇综述中,我们提供了一个全面的回顾,旨在帮助刚开始探索情绪识别与生成的研究人员。我们介绍了面部、语音和文本等不同模态下情绪识别与生成的基本原理。本作品将近期的先进研究按不同的技术方法进行了分类,并解释了这些方法的理论基础和动机,为它们的应用提供更清晰的理解。此外,我们讨论了评估指标、比较分析以及当前的局限性,并阐明了领域内研究人员面临的挑战。最后,我们提出未来的研究方向以应对这些挑战,并鼓励进一步探索开发出稳健、有效且负责任的情绪识别与生成系统。