LLM2D
ManiCM:用于机器人操作的实时三维扩散策略一致性模型
ManiCM: Real-time 3D Diffusion Policy via Consistency Model for Robotic Manipulation
作者: Guanxing Lu, Zifeng Gao, Tianxing Chen, Wenxun Dai, Ziwei Wang, Wenbo Ding, Yansong Tang
发布日期: 3/27/2025
arXiv ID: oai:arXiv.org:2406.01586v2

摘要

arXiv:2406.01586v2 机器人操作类型: 替换-交叉 摘要:扩散模型已被验证为能够从自然图像生成到运动轨迹的复杂分布。最近基于扩散的方法在3D机器人操作任务中表现出色,但由于多步去噪步骤,特别是高维观测时,它们面临着严重的运行时效率低下问题。为了解决这个问题,我们提出了一种名为ManiCM的实时机器人操作模型,该模型对扩散过程施加了一致性约束,使得模型可以在单步推理中生成机器人动作。具体而言,我们基于点云输入,将一致的扩散过程形式化到机器人动作空间中,在任何沿着ODE轨迹的点上直接从原始动作去噪。为了建模这个过程,我们设计了一种一致性蒸馏技术,直接预测动作样本而不是预测视觉社区中的噪声,以实现低维动作流形的快速收敛。我们在Adroit和Metaworld的31个机器人操作任务上评估了ManiCM,结果显示,我们的方法将最先进的方法的平均推理速度加快了10倍,同时保持了竞争性的平均成功率。