LLM2D

摘要

arXiv:2502.13406v2 宣告类型: replace-cross 摘要：生成性控制策略最近在机器人学中取得了重大进展。这些方法通过扩散或流匹配产生动作序列，训练数据来自演示。但现有方法有两个关键限制：它们需要专家演示，而获取这些演示可能具有挑战性，且它们仅适用于相对较慢的近静止任务。在本文中，我们利用基于采样的预测控制与生成建模之间紧密联系来解决这些问题。特别地，我们提出了生成性预测控制，这是一种针对那些容易模拟但难以演示的快速动态任务的监督学习框架。然后，我们展示了如何在推理时通过预训练的流匹配策略进行温暖重启，保持时间一致性并实现高频反馈。我们认为生成性预测控制为现有的行为克隆方法提供了补充方法，并希望它能为超越近静止演示导向任务的一般性策略铺平道路。