LLM2D
从单次示范学习适应性灵巧抓取
Learning Adaptive Dexterous Grasping from Single Demonstrations
作者: Liangzhi Shi, Yulin Liu, Lingqi Zeng, Bo Ai, Zhengdong Hong, Hao Su
发布日期: 3/27/2025
arXiv ID: oai:arXiv.org:2503.20208v1

摘要

arXiv:2503.20208v1 宣告类型:交叉 摘要:机器人如何高效地学习灵巧的抓取技能,并基于用户的指示进行适应性应用?本工作克服了两个关键挑战:从有限的人类演示中高效地习得技能和基于上下文进行技能选择。我们引入了AdaDexGrasp框架,从每个技能仅一个人类演示中学习一组抓取技能,并通过视图语言模型(VLM)选择最合适的技能。为了提高采样效率,我们提出了轨迹跟随奖励,引导强化学习(RL)朝向接近人类演示的状态,并允许探索灵活性。为了超越单一演示,我们采用了课程学习法,逐步增加物体姿态的变化以提高鲁棒性。在部署时,VLM 根据用户的指示检索合适的技能,将低级学习的技能与高级意图连接起来。我们在仿真和实际环境中评估了AdaDexGrasp,在各种物体配置中展示了我们的方法显著提高了RL的效率,并使机器人能够学习类似人类的抓取策略。最后,我们展示了我们的学习策略在实际环境中对PSYONIC Ability Hand的零样本迁移,成功率高达90%,显著优于基线。