LLM2D

摘要

arXiv:2502.13406v1 宣告类型: cross 摘要：生成控制策略最近在机器人领域取得了重大进展。这些方法通过扩散或流匹配产生动作序列，训练数据来自于演示。尽管在复杂的操作问题上取得了显著成功，生成策略仍然存在两个关键局限性。首先，行为克隆需要专家演示，这往往耗时且成本高昂。其次，现有的方法限制在相对较慢的准静态任务上。本文利用基于采样的预测控制与生成建模之间的紧密联系来解决这两个问题。特别是，我们引入了生成预测控制，这是一种监督学习框架，适用于快速动力学任务，这些任务易于模拟但难以演示。随后，我们展示了如何在运行时使用训练好的流匹配策略进行热启动，保持时间一致性，并允许快速反馈率。我们认为，生成预测控制为现有的行为克隆方法提供了一种补充方法，希望这能铺平通往超越准静态演示任务的一般性策略的道路。