摘要
arXiv:2406.01586v2 机器人操作类型: 替换-交叉
摘要:扩散模型已被验证为能够从自然图像生成到运动轨迹的复杂分布。最近基于扩散的方法在3D机器人操作任务中表现出色,但由于多步去噪步骤,特别是高维观测时,它们面临着严重的运行时效率低下问题。为了解决这个问题,我们提出了一种名为ManiCM的实时机器人操作模型,该模型对扩散过程施加了一致性约束,使得模型可以在单步推理中生成机器人动作。具体而言,我们基于点云输入,将一致的扩散过程形式化到机器人动作空间中,在任何沿着ODE轨迹的点上直接从原始动作去噪。为了建模这个过程,我们设计了一种一致性蒸馏技术,直接预测动作样本而不是预测视觉社区中的噪声,以实现低维动作流形的快速收敛。我们在Adroit和Metaworld的31个机器人操作任务上评估了ManiCM,结果显示,我们的方法将最先进的方法的平均推理速度加快了10倍,同时保持了竞争性的平均成功率。