LLM2D

摘要

arXiv:2503.20208v1 宣告类型：交叉摘要：机器人如何高效地学习灵巧的抓取技能，并基于用户的指示进行适应性应用？本工作克服了两个关键挑战：从有限的人类演示中高效地习得技能和基于上下文进行技能选择。我们引入了AdaDexGrasp框架，从每个技能仅一个人类演示中学习一组抓取技能，并通过视图语言模型（VLM）选择最合适的技能。为了提高采样效率，我们提出了轨迹跟随奖励，引导强化学习（RL）朝向接近人类演示的状态，并允许探索灵活性。为了超越单一演示，我们采用了课程学习法，逐步增加物体姿态的变化以提高鲁棒性。在部署时，VLM 根据用户的指示检索合适的技能，将低级学习的技能与高级意图连接起来。我们在仿真和实际环境中评估了AdaDexGrasp，在各种物体配置中展示了我们的方法显著提高了RL的效率，并使机器人能够学习类似人类的抓取策略。最后，我们展示了我们的学习策略在实际环境中对PSYONIC Ability Hand的零样本迁移，成功率高达90%，显著优于基线。