LLM2D

摘要

arXiv:2411.00927v2 宣告类型: replace-cross 摘要：基于大型语言模型（LLM）的代理越来越多地被用于与外部环境（如游戏、API、世界模型）交互以解决用户提供的任务。然而，当前的框架往往缺乏在全对话环境中与用户有效协作的能力。对话对于对齐任务细节、实现用户定义的目标并满足其偏好至关重要。虽然现有的代理通过澄清问题来应对模糊性，但它们未能充分利用LLM对话能力的更大潜力。在这项工作中，我们引入了ReSpAct，这是一种设计用于无缝集成推理、决策和动态对话以解决任务的LLM代理。扩展了以推理为主的ReAct方法，ReSpAct利用主动、自由流动的对话来解释指令、澄清目标、提供状态更新、解决子任务失败，并基于用户输入调整计划，而无需任何明确的对话模式。通过交替进行任务解决动作和互动对话，ReSpAct在多种环境中表现出改进的性能。我们在用户交互设置中评估了ReSpAct，包括任务导向对话系统（MultiWOZ）和决策任务（ALFWorld、WebShop）。在ALFWorld和WebShop中，ReSpAct分别比ReAct在绝对成功率上提高了6%和4%；在MultiWOZ中，ReSpAct实现了5.5%的信息传递得分提升和3%的成功率提升。这些结果突显了集成动态用户-代理协作对于更有效的任务解决的价值。