LLM2D

摘要

arXiv:2504.09689v3 安全公告类型: 替换摘要：以大规模语言模型 (LLM) 为驱动力的AI角色的兴起引发了安全方面的担忧，尤其是对于那些患有心理障碍的易受伤害的人类用户。为应对这些风险，我们提出了EmoAgent，这是一种多智能体AI框架，旨在评估和减轻人类与AI交互过程中的心理健康风险。EmoAgent包括两个组成部分：EmoEval模拟虚拟用户，包括那些模拟心理健康脆弱个体的用户，以评估在与AI角色交互前后的情绪变化。它使用临床证明的心理学和精神病学评估工具（PHQ-9、PDI、PANSS）来评估由LLM引起的心理健康风险。EmoGuard作为中介，监控用户的情绪状态，预测潜在的危害，并提供矫正反馈以减轻风险。在流行的基于角色的聊天机器人中进行的实验表明，情感参与的对话可能会导致易受伤害用户的心理恶化，在超过34.4%的模拟中，心理状态有所恶化。EmoGuard显著降低了这些恶化率，突显了其在确保更安全的AI-人交互方面的作用。我们的代码可以在以下链接找到：https://github.com/1akaman/EmoAgent