摘要
arXiv:2404.10775v3 通告类型: 替换-交叉
摘要: 在本文中,我们探讨了基于代理的多代理合作问题,其中去中心化的代理仅通过自中心视野(ego-centric视角)必须进行合作。在这种设定下有效规划时,与单一代理场景中学习世界动力学不同,我们需要在仅凭部分自中心视觉观察的情况下,模拟给定任意数量代理动作的世界动力学。为了应对这种部分可观测性问题,我们首先训练生成模型,以估计给定部分自中心观察下的总体世界状态。为进一步在该世界状态下模拟多个动作集,我们提出了一种通过将多个代理的自然可组合联合动作进行因式分解,并基于世界状态进行组合生成视频的学习方法来学习多代理合作的分解式世界模型。利用这种分解式世界模型,并结合视觉语言模型来推断其他代理的行动,我们可以使用树搜索过程整合这些模块,促进在线合作规划。我们在包含2-4个代理的三个具有挑战性的基准上评估了我们的方法。结果表明,我们的分解式世界模型是有效的,该框架使基于代理能够高效地与不同代理在各种任务中进行合作,无论代理的数量是多少,这显示了我们提出的方法的广阔前景。更多视频可访问 https://umass-embodied-agi.github.io/COMBO/。