LLM2D

摘要

arXiv:2409.10027v4 通知类型: 替换交叉摘要：大规模语言模型（LLMs）在指导实体代理执行语言指令方面显示出巨大的潜力，涵盖了从机器人操作到导航等一系列任务。然而，现有的方法主要针对静态环境设计，并未利用代理自身的经验来改善其初始计划。鉴于现实世界的环境本质上是 stochastic 的，仅依赖于 LLM 通用知识的初始计划在现实环境中可能无法实现其目标，而在静态场景中则不会出现这种问题。为解决这一局限性，本研究引入了经验与情感地图（E2Map），结合了不仅包括 LLM 知识，还整合了代理在现实世界中的经验，借鉴了人类情感反应的灵感。所提出的方法通过根据代理的经验更新 E2Map 来实现一次性的行为调整。在 stochastic 导航环境中的评估，包括仿真和真实世界场景，表明所提方法相比现有的基于 LLM 的方法显著提高了在 stochastic 环境中的性能。相关代码和补充材料可在 https://e2map.github.io/ 获取。