摘要
arXiv:2504.03561v1 类型: cross
摘要: 在代理与环境的交互过程中,代理通过规划和执行行动来扩展其能力。然而,基于LLM的代理在部署于全新环境或需要导航非传统行动空间时会面临诸多挑战。为了使代理能够自主探索环境、优化工作流并增强其对行动的理解,我们提出了SynWorld框架,该框架允许代理在行动空间内合成可能的情景和多步行动调用,并通过蒙特卡洛树搜索(MCTS)探索有效地精确其当前环境中的行动知识。我们的实验表明,SynWorld是一种有效且通用的学习新环境行动知识的方法。相关代码可在https://github.com/zjunlp/SynWorld获取。