LLM2D
AdaWorld:学习潜在动作的可适应世界模型
AdaWorld: Learning Adaptable World Models with Latent Actions
作者: Shenyuan Gao, Siyuan Zhou, Yilun Du, Jun Zhang, Chuang Gan
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2503.18938v2

摘要

arXiv:2503.18938v2 宣告类型: 替换 摘要:世界模型旨在学习受行动控制的未来预测,并已被证明对于智能代理的发展至关重要。然而,现有的大多数世界模型严重依赖大量的带有动作标签的数据以及昂贵的训练过程,使得通过有限的交互适应具有异质动作的新环境变得具有挑战性。这一限制可能会阻碍它们在更广泛的领域中的应用。为克服这一限制,我们提出了一种名为AdaWorld的创新世界模型学习方法,以实现高效的适应。核心思想是在世界模型的预训练阶段融入动作信息。这通过自监督的方式从视频中提取潜在动作,捕捉帧之间的最关键转换来实现。然后,我们开发了一种基于这些潜在动作的自回归世界模型。这种学习范式使得世界模型具有高度的适应性,即使在有限的交互和微调的情况下,也能高效地转移和学习新的行动。我们在多个环境的全面实验中表明,AdaWorld 在仿真质量和视觉规划方面都达到了 superior 的性能。