摘要
arXiv:2502.07202v1 宣告类型: 新
摘要: 近期,扩散模型作为规划工具展现出了强大的能力。然而,与其他自然随着测试时计算量(TTC)增加而性能提升的方法(如蒙特卡罗树搜索MCTS)不同,标准的基于扩散的规划器在TTC可扩展性方面提供的途径有限。在这篇论文中,我们引入了Monte Carlo Tree Diffusion (MCTD),这是一种新型框架,将扩散模型的生成能力与MCTS的自适应搜索能力相结合。我们的方法将去噪重新构想为一个树状过程,允许部分去噪的计划进行迭代评估、修剪和改进。通过有选择地扩展有前途的轨迹,同时保留重新访问并改进次优分支的灵活性,MCTD在扩散框架内实现了MCTS的诸如控制探索与利用权衡等优点。在具有挑战性的长时_horizon_任务上的实验证明,MCTD在TTC增加时能提供更高质量的解决方案,优于扩散基线方法。