LLM2D
Home
Arxiv
返回列表
PIANIST:利用大型语言模型学习部分可观测世界模型以进行多智能体决策
PIANIST: Learning Partially Observable World Models with LLMs for Multi-Agent Decision Making
作者:
Jonathan Light, Sixue Xing, Yuanzhe Liu, Weiqin Chen, Min Cai, Xiusi Chen, Guanzhi Wang, Wei Cheng, Yisong Yue, Ziniu Hu
发布日期:
11/26/2024
arXiv ID:
oai:arXiv.org:2411.15998v1
摘要
大型语言模型 (LLM) 在复杂决策任务中有效提取世界知识仍然是一个挑战。我们提出了一种名为 PIANIST 的框架,将世界模型分解成七个直观的组件,有利于零样本 LLM 生成。仅给定游戏的自然语言描述和输入观测数据的格式,我们的方法就可以生成一个可用于快速高效蒙特卡洛树搜索 (MCTS) 模拟的工作世界模型。我们展示了我们的方法在两个不同的游戏中效果良好,这两个游戏都挑战了智能体的规划和决策能力,涉及基于语言和非语言的动作执行,并且无需任何特定领域的训练数据或明确定义的世界模型。
查看原文
下载 PDF