LLM2D

摘要

arXiv:2502.11221v1 宣布类型：新摘要：大规模语言模型（LLMs）在生成计划方面具有巨大的潜力，能够将初始世界状态转化为期望的目标状态。大量的研究探讨了LLMs在各种规划任务中的应用，从网络导航到旅行规划和数据库查询。然而，这些系统往往针对具体问题进行设计，这使得它们之间难以比较或确定新任务的最佳方法。此外，缺乏明确和一致的评估标准。我们的调查旨在提供一个全面的LLM规划概述，以填补这一空白。它基于Kartam和Wilkins（1990年）的基础工作，并考察了六项关键性能标准：完备性、可执行性、最优性、表示性、泛化能力和效率。对于每一项，我们提供了代表性作品的详尽分析，并指出了它们的优点和缺点。本文还指出了未来的关键方向，使其成为希望利用LLM规划支持代理工作流程的从业者和新入门人员的重要资源。