LLM2D

摘要

arXiv:2409.15095v2 公告类型：替换-交叉摘要：演示数据在学习复杂行为和训练机器人基础模型中起着关键作用。虽然静态机械臂已经存在有效的控制界面，但为了移动机械臂的数据收集仍然因自由度众多而复杂且耗时。虽然专门的硬件、化身或动作追踪可以实现整个身体的控制，但这些方法或是昂贵的、特定于机器人、或是导致机器人与人类演示者之间的束缚不符。在此项工作中，我们提出了MoMa-Teleop，一种新颖的遥操作方法，该方法从现有界面中推断末端执行器运动，并将基础运动委派给之前开发的强化学习代理，使操作员可以完全专注于任务相关的末端执行器运动。这使得用户可以通过标准界面（如摇杆或手部引导）对移动机械臂进行整身体操，并且无需额外的硬件或设置成本。此外，操作员不受追踪的工作空间限制，可以在空间扩展的任务中自由移动与机器人一起。我们证明，我们的方法可以显著减少不同机器人和任务上的任务完成时间。由于生成的数据覆盖了多种不同的整身体操动作，且没有束缚不符的问题，因此能够实现高效的模仿学习。通过专注于任务特定的末端执行器运动，我们的方法能够在最少五次演示的情况下从新的障碍物或改变的对象位置中学习技能。我们在https://moma-teleop.cs.uni-freiburg.de上提供了代码和视频。