摘要
arXiv:2409.10027v4 通知类型: 替换交叉
摘要:大规模语言模型(LLMs)在指导实体代理执行语言指令方面显示出巨大的潜力,涵盖了从机器人操作到导航等一系列任务。然而,现有的方法主要针对静态环境设计,并未利用代理自身的经验来改善其初始计划。鉴于现实世界的环境本质上是 stochastic 的,仅依赖于 LLM 通用知识的初始计划在现实环境中可能无法实现其目标,而在静态场景中则不会出现这种问题。为解决这一局限性,本研究引入了经验与情感地图(E2Map),结合了不仅包括 LLM 知识,还整合了代理在现实世界中的经验,借鉴了人类情感反应的灵感。所提出的方法通过根据代理的经验更新 E2Map 来实现一次性的行为调整。在 stochastic 导航环境中的评估,包括仿真和真实世界场景,表明所提方法相比现有的基于 LLM 的方法显著提高了在 stochastic 环境中的性能。相关代码和补充材料可在 https://e2map.github.io/ 获取。