LLM2D
精确标注的人类示范的模仿学习
Imitation Learning with Precisely Labeled Human Demonstrations
作者: Yilong Song
发布日期: 4/21/2025
arXiv ID: oai:arXiv.org:2504.13803v1

摘要

arXiv:2504.13803v1 类别: cross 摘要: 在拟人学习范式中,训练通用机器人需要通过多样化的整理才能获得的大量数据集。由于人类演示易于收集,适当地结合人类演示可以作为有价值的数据来源。然而,现有利用人类演示的方法在推断精确动作、改善实体差距以及与前沿通用机器人训练管道融合方面面临挑战。在此工作中,基于先前研究表明手持夹具可用于有效数据收集的研究成果,我们利用用户对手持夹具外观的控制能力——具体是赋予其一个独特且易于分割的颜色——来启用简单的可靠的使用 RANSAC 和 ICP 注册方法进行精确末端效应器姿态估计的应用。我们通过模拟显示,仅精确标注的人类演示可以让策略的性能平均达到使用机器人演示性能的88.1%,即使在存在固有的实体差距的情况下,当与机器人演示结合使用时,也能提升策略的性能。