摘要
arXiv:2502.17432v2 通知类型: 交叉替换
摘要:人类执行的许多接触密集型任务,如捡拾箱子或擀面团,都依赖于力反馈以实现可靠执行。然而,大多数机器人臂中易于获得的力信息在远程操作和策略学习中并未得到充分利用。因此,机器人的行为往往局限于不需要复杂力反馈的准静态运动学任务。在本文中,我们首先提出了一种低成本、直观的双边远程操作设置,该设置将跟随臂的外部力信息反馈给教师臂,从而促进复杂接触密集型任务的数据收集。然后,我们介绍了FACTR,一种采用递进课程的学习方法,该方法通过在整个训练过程中逐渐降低视觉输入的干扰来利用变压器模型。该课程防止我们的基于变压器的策略过度拟合到视觉输入,并引导策略正确关注力模态。我们证明通过充分利用力信息,我们的方法在与没有课程的基础方法相比的情况下,显著提高了对未见过的物体的泛化能力,提高了43%。视频结果、代码库和使用方法可参见 https://jasonjzliu.com/factr/