摘要
arXiv:2403.17246v2 宣告类型: 修改
摘要: 经典的规划形式化方法,如规划域定义语言(PDDL),在给定一个初始状态的情况下,可以确保实现一个目标状态,前提是任何可能的行动序列都可以实现。然而,在PDDL中定义的推理问题并未捕捉到行动时间方面的细节,例如,在没有冲突条件的情况下,两个代理之间的并发行动,除非进行显著的修改和对现有PDDL域的定义。一个了解这些约束条件的人类专家可以将目标分解为次目标,每个次目标都可以通过单个代理的规划来实现,从而利用同时行动。与经典规划不同,直接用于推断规划步骤的大型语言模型(LLMs)通常不能保证执行成功,但能够利用常识推理来组装行动序列。我们通过近似多代理规划目标分解的人类直觉,结合了经典规划和LLMs的优点。我们证明,基于LLMs的目标分解可以比直接解决多代理PDDL问题更快地进行规划,同时比单代理计划的步骤更少,也比大多数多代理计划更少,同时保证执行成功。此外,我们发现基于LLMs的次目标近似能够产生与人类专家指定的执行长度相似的多代理执行长度。网站和资源详见 https://glamor-usc.github.io/twostep