LLM2D
系统2规划的蒙特卡洛树扩散方法
Monte Carlo Tree Diffusion for System 2 Planning
作者: Jaesik Yoon, Hyeonseo Cho, Doojin Baek, Yoshua Bengio, Sungjin Ahn
发布日期: 4/14/2025
arXiv ID: oai:arXiv.org:2502.07202v2

摘要

arXiv:2502.07202v2 宣布类型: 替换 摘要:扩散模型最近已成为一种强大的规划工具。然而,与蒙特卡洛树搜索(MCTS)不同,MCTS 的性能随着测试时间计算(TTC)的增加而自然提高,而标准的基于扩散的规划器在 TTC 可扩展性方面提供的途径有限。在本文中,我们引入了蒙特卡洛树扩散(MCTD),这是一种新颖的框架,将扩散模型的生成能力与 MCTS 的自适应搜索能力相结合。我们的方法将去噪重新概念化为一种树结构过程,允许部分去噪的计划迭代地评估、修剪和改进。通过选择性地扩展有前途的轨迹,同时保留返回并改进非最优分支的灵活性,MCTD 在扩散框架内实现了 MCTS 的好处,如管理探索与利用的权衡。在挑战性的长期任务上的实验结果表明,MCTD 在 TTC 增加时提供了更高的质量的解决方案,优于扩散基线。