LLM2D
ReSpAct: 朝着构建基于大型语言模型的对话AI代理 harmonize 值得言和行
ReSpAct: Harmonizing Reasoning, Speaking, and Acting Towards Building Large Language Model-Based Conversational AI Agents
作者: Vardhan Dongre, Xiaocheng Yang, Emre Can Acikgoz, Suvodip Dey, Gokhan Tur, Dilek Hakkani-T\"ur
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2411.00927v2

摘要

arXiv:2411.00927v2 宣告类型: replace-cross 摘要:基于大型语言模型(LLM)的代理越来越多地被用于与外部环境(如游戏、API、世界模型)交互以解决用户提供的任务。然而,当前的框架往往缺乏在全对话环境中与用户有效协作的能力。对话对于对齐任务细节、实现用户定义的目标并满足其偏好至关重要。虽然现有的代理通过澄清问题来应对模糊性,但它们未能充分利用LLM对话能力的更大潜力。在这项工作中,我们引入了ReSpAct,这是一种设计用于无缝集成推理、决策和动态对话以解决任务的LLM代理。扩展了以推理为主的ReAct方法,ReSpAct利用主动、自由流动的对话来解释指令、澄清目标、提供状态更新、解决子任务失败,并基于用户输入调整计划,而无需任何明确的对话模式。通过交替进行任务解决动作和互动对话,ReSpAct在多种环境中表现出改进的性能。我们在用户交互设置中评估了ReSpAct,包括任务导向对话系统(MultiWOZ)和决策任务(ALFWorld、WebShop)。在ALFWorld和WebShop中,ReSpAct分别比ReAct在绝对成功率上提高了6%和4%;在MultiWOZ中,ReSpAct实现了5.5%的信息传递得分提升和3%的成功率提升。这些结果突显了集成动态用户-代理协作对于更有效的任务解决的价值。