LLM2D
反应扩散策略:接触丰富操作中的慢速-快速视觉-触觉政策学习
Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation
作者: Han Xue, Jieji Ren, Wendi Chen, Gu Zhang, Yuan Fang, Guoying Gu, Huazhe Xu, Cewu Lu
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2503.02881v3

摘要

arXiv:2503.02881v3 宣告类型: replace-cross 摘要:人类可以利用视觉和触觉来完成复杂的接触性任务,具备快速应对外部变化的高反应能力以及对接触力的自适应控制;然而,这对机器人来说仍然是一个挑战。现有的视觉模仿学习(IL)方法依赖于动作分块来建模复杂的行为,但在分块执行过程中无法实时响应触觉反馈。此外,大多数远程操作系统在提供细粒度的触觉/力反馈方面存在困难,这限制了可执行的任务范围。为了解决这些挑战,我们引入了 TactAR,这是一个低成本的远程操作系统,通过增强现实(AR)提供实时触觉反馈,并结合了一种新型的两阶段视觉-触觉模仿学习算法——反应扩散策略(RDP),用于学习复杂的接触性操作技能。RDP 采用两层层次结构:(1)低频的慢速潜在扩散策略,用于在潜在空间中预测高层动作分块;(2)高频的非对称标记器,用于闭环触觉反馈控制。这种设计能够在统一框架中实现复杂的轨迹建模和快速的反应行为。通过在三个具有挑战性的接触性任务上的广泛评估,RDP 显著提高了与最先进的视觉 IL 基线相比的表现。此外,实验结果表明,RDP 在不同类型的触觉/力传感器上都是适用的。代码和视频可在 https://reactive-diffusion-policy.github.io 获取。