摘要
arXiv:2502.11882v1 宣布类型: 新闻
摘要:基于大规模语言模型(LLMs)的代理在逐轮的人工智能协作方面表现出色,但在需要实时互动的并发任务方面存在困难。延迟问题以及推断变化的人类策略的挑战阻碍了它们在没有明确指令的情况下做出自主决策的能力。通过使用当前独立的系统1和系统2方法进行实验,我们验证了在实时任务中使用双重过程理论(DPT)的必要性。我们提出了DPT-Agent,这是一种新颖的语言代理框架,将系统1和系统2结合在一起,以实现高效的实时并发人机协作。DPT-Agent的系统1采用有限状态机(FSM)和代码作为策略,进行快速、直观且可控的决策。DPT-Agent的系统2结合了心理理论(ToM)和异步反思,以推断人类意图并执行基于推理的自主决策。我们通过进一步使用基于规则的代理和人类合作者的实验,展示了DPT-Agent的有效性,显示出在主流基于LLM的框架中的显著改进。据我们所知,DPT-Agent是第一个实现了成功的实时并发人机协作的自主语言代理框架。DPT-Agent的代码可以在 https://github.com/sjtu-marl/DPT-Agent 查找。