LLM2D

摘要

arXiv:2502.01143v3 类别：替换-交叉摘要：人形机器人在执行人体类似的整体技能方面具有前所未有的灵活性潜力。然而，由于模拟与现实世界之间的动力学不匹配，实现敏捷和协调的整体动作仍然是一项重大挑战。现有的方法，如系统辨识（SysID）和领域随机化（DR）方法，通常依赖于耗时的参数调整，或者导致过于保守的策略，牺牲了灵活性。在本文中，我们提出了ASAP（Aligning Simulation and Real-World Physics），这是一种两阶段框架，旨在解决动力学不匹配问题，并使人形机器人能够实现灵活的整体动作。在第一阶段，我们使用重新定向的人类动作数据在模拟中预训练动作跟踪策略。在第二阶段，我们部署这些策略到现实世界，并收集现实世界的数据来训练一个delta（残差）动作模型，该模型用于补偿动力学不匹配。然后，ASAP将预训练策略与集成到模拟器中的delta动作模型进行微调，以有效对齐与现实世界动力学。我们分别在三种转移场景中评估ASAP：IsaacGym到IsaacSim、IsaacGym到Genesis以及IsaacGym到现实世界中的Unitree G1人形机器人。我们的方法显著提高了各种动态动作的敏捷性和整体协调性，相比系统辨识、领域随机化和动态残差学习的基线方法，减少了跟踪误差。ASAP使之前难以实现的高敏捷动作成为可能，展示了delta动作学习在弥合模拟与现实世界动力学之间的差距方面的潜力。这些结果表明，delta动作学习为开发更富有表现力和敏捷的人形机器人提供了一个有希望的从模拟到现实的方向。