LLM2D
PlanGenLLMs:大规模语言模型规划能力现代综述
PlanGenLLMs: A Modern Survey of LLM Planning Capabilities
作者: Hui Wei, Zihao Zhang, Shenghua He, Tian Xia, Shijia Pan, Fei Liu
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11221v1

摘要

arXiv:2502.11221v1 宣布类型:新 摘要:大规模语言模型(LLMs)在生成计划方面具有巨大的潜力,能够将初始世界状态转化为期望的目标状态。大量的研究探讨了LLMs在各种规划任务中的应用,从网络导航到旅行规划和数据库查询。然而,这些系统往往针对具体问题进行设计,这使得它们之间难以比较或确定新任务的最佳方法。此外,缺乏明确和一致的评估标准。我们的调查旨在提供一个全面的LLM规划概述,以填补这一空白。它基于Kartam和Wilkins(1990年)的基础工作,并考察了六项关键性能标准:完备性、可执行性、最优性、表示性、泛化能力和效率。对于每一项,我们提供了代表性作品的详尽分析,并指出了它们的优点和缺点。本文还指出了未来的关键方向,使其成为希望利用LLM规划支持代理工作流程的从业者和新入门人员的重要资源。