LLM2D

摘要

大型语言模型 (LLM) 在复杂决策任务中有效提取世界知识仍然是一个挑战。我们提出了一种名为 PIANIST 的框架，将世界模型分解成七个直观的组件，有利于零样本 LLM 生成。仅给定游戏的自然语言描述和输入观测数据的格式，我们的方法就可以生成一个可用于快速高效蒙特卡洛树搜索 (MCTS) 模拟的工作世界模型。我们展示了我们的方法在两个不同的游戏中效果良好，这两个游戏都挑战了智能体的规划和决策能力，涉及基于语言和非语言的动作执行，并且无需任何特定领域的训练数据或明确定义的世界模型。