LLM2D

摘要

arXiv:2502.01143v1 交叉类型: cross 摘要: 人类机器人在执行人体动作、全身技能方面具有无与伦比的灵活性潜力。然而，由于仿真与现实世界的动力学不匹配，实现敏捷且协调的全身动作仍是一项重大挑战。现有的方法，如系统辨识(SysID)和域随机化(DR)方法，往往依赖于劳动密集型的参数调整，或者导致策略过于保守，牺牲了敏捷性。在本文中，我们提出了一种名为ASAP（.aligning simulation and real-world physics）的两阶段框架，旨在解决动力学不匹配问题并使人类机器人能够执行敏捷的全身动作。在第一阶段，我们使用重新定向的人类动作数据在仿真中预先训练动作跟踪策略。在第二阶段，我们在现实世界中部署策略并收集实际数据以训练一个增量（残差）动作模型，该模型可以弥补动力学不匹配。然后，ASAP将预训练的策略与集成到仿真的增量动作模型进行微调，以有效对齐实际动力学。我们在三个传输场景中评估了ASAP：IsaacGym到IsaacSim、IsaacGym到Genesis以及IsaacGym到现实世界的Unitree G1人形机器人。我们的方法在各种动态动作下显著提高了敏捷性与全身协调性，与系统辨识(SysID)、域随机化(DR)和增量动力学习baseline相比，减少了跟踪误差。ASAP使先前难以实现的高敏捷运动成为可能，证明了增量动作学习在连接仿真与现实动力学方面的潜力。这些结果表明，通过delta动作学习从仿真到现实的转化方向具有开发更具表现力和敏捷性的机器人潜力。