LLM2D

摘要

arXiv:2503.03045v2 宣告类型: replace-cross 摘要: 本文介绍了ArticuBot，在这个系统中，单一学习出的策略能够让机器人系统在现实世界中打开多种未见过的铰接物体。由于这类物体的几何形状、尺寸和铰接类型存在巨大差异，这一任务长期以来一直是机器人技术的挑战。我们的系统，ArticuBot，由三个部分组成：在基于物理的模拟中生成大量演示；通过模仿学习将所有生成的演示提炼为基于点云的神经策略；以及在真实机器人系统上进行零样本仿真实验转移。利用基于采样的抓取和运动规划，我们的演示泛化流水线既快速又有效，总共生成了42,300个演示，用于322个训练铰接物体。在策略学习方面，我们提出了一种新颖的分层策略表示方法，在这种方法中，高层次策略学习末端执行器的目标，而低层次策略则在预测的目标条件下学习如何移动末端执行器。我们证明了这种分层方法相较于非分层版本在物体级别泛化方面表现更好。我们还提出了一种适用于高层次策略的新加权位移模型，将预测与场景中存在的3D结构进行对接，优于其他策略表示方法。我们展示了我们的学习策略可以零样本跨三个不同的真实机器人环境进行迁移：两间不同实验室中固定在桌上的Franka手臂，以及用于在两间不同实验室、真实休息室和厨房中打开多种未见过的铰接物体的移动基座上的X-Arm。相关视频和代码可以在我们的项目网站上找到：https://articubot.github.io/。