LLM2D
EmoAgent:评估和保障人类与人工智能交互以确保心理健康安全
EmoAgent: Assessing and Safeguarding Human-AI Interaction for Mental Health Safety
作者: Jiahao Qiu, Yinghui He, Xinzhe Juan, Yimin Wang, Yuhan Liu, Zixin Yao, Yue Wu, Xun Jiang, Ling Yang, Mengdi Wang
发布日期: 5/1/2025
arXiv ID: oai:arXiv.org:2504.09689v3

摘要

arXiv:2504.09689v3 安全公告类型: 替换 摘要:以大规模语言模型 (LLM) 为驱动力的AI角色的兴起引发了安全方面的担忧,尤其是对于那些患有心理障碍的易受伤害的人类用户。为应对这些风险,我们提出了EmoAgent,这是一种多智能体AI框架,旨在评估和减轻人类与AI交互过程中的心理健康风险。EmoAgent包括两个组成部分:EmoEval模拟虚拟用户,包括那些模拟心理健康脆弱个体的用户,以评估在与AI角色交互前后的情绪变化。它使用临床证明的心理学和精神病学评估工具(PHQ-9、PDI、PANSS)来评估由LLM引起的心理健康风险。EmoGuard作为中介,监控用户的情绪状态,预测潜在的危害,并提供矫正反馈以减轻风险。在流行的基于角色的聊天机器人中进行的实验表明,情感参与的对话可能会导致易受伤害用户的心理恶化,在超过34.4%的模拟中,心理状态有所恶化。EmoGuard显著降低了这些恶化率,突显了其在确保更安全的AI-人交互方面的作用。我们的代码可以在以下链接找到:https://github.com/1akaman/EmoAgent