LLM2D

摘要

arXiv:2502.10363v3 Announce Type: replace-cross 摘要：在稀疏立足点的地面上穿越危险地形对人形机器人构成了重大挑战，需要精确的足部放置和稳定的移动。现有的基于学习的方法往往在这样的复杂地形上遇到困难，因为稀疏的立足点奖励和学习过程效率低下。为应对这些挑战，我们提出了BeamDojo，这是一种用于在稀疏立足点上使能灵活人形移动的增强学习（RL）框架。BeamDojo首先引入了一种针对多边形脚部设计的基于采样的立足点奖励，同时还引入了双重评论家来平衡密集移动奖励和稀疏立足点奖励之间的学习过程。为了促进足够的尝试和错误探索，BeamDojo采用了两阶段的RL方法：第一阶段通过在平坦地面上训练人形机器人并提供任务地形感知观察来缓解地形动态，第二阶段在实际的任务地形上细化策略。此外，我们实施了一种基于机载LiDAR的高度图，以实现实际部署。广泛的仿真和实地实验表明，BeamDojo在仿真中实现了高效的学习，并能够在实际中实现出色的足部放置和灵活移动，即使在显著的外部干扰下也能够保持高成功率。