LLM2D

摘要

arXiv:2502.01143v2 宣布类型: 替换-交叉摘要：类人机器人在执行像人类一样的全身技能方面具有前所未有的灵活性潜力。然而，由于仿真与现实世界之间的动力学不匹配，实现灵活和协调的全身运动仍是一个重大挑战。现有的方法，如系统识别（SysID）和领域随机化（DR）方法，往往依赖于劳动密集型的参数调整，或者导致过于保守的策略，牺牲了灵活性。在本文中，我们提出了ASAP（使仿真与真实世界物理对齐）框架，用于解决动力学不匹配问题，并实现灵活的类人机器人全身技能。在第一阶段，我们使用重新定向的人体动作数据在仿真中预训练动作跟踪策略。在第二阶段，我们将策略部署到现实世界中，并收集现实世界的数据显示一个差值（残差）动作模型，以补偿动力学不匹配。然后，ASAP将差值动作模型集成到仿真器中，微调预训练策略，以更有效地与现实世界动力学对齐。我们通过三个转移场景评估了ASAP：IsaacGym到IsaacSim，IsaacGym到Genesis，以及IsaacGym到现实世界的Unitree G1类人机器人。我们的方法在各种动态动作中显著提高了灵活性和全身协调性，相比SysID、DR和差值动力学学习基准，降低了跟踪误差。ASAP使以前难以实现的高度灵活动作成为可能，证明了差值动作学习在弥合仿真和现实世界动力学方面的潜力。这些结果表明了从仿真到现实世界的有希望的方向，用于开发更具表现力和灵活的类人机器人。