LLM2D

摘要

arXiv:2502.10363v1 宣告类型: cross 摘要: 在稀疏立足点下穿越危险地形对类人机器人提出了重大挑战，要求精确的足部放置和稳定的移动。现有的专为四足机器人设计的方法由于足部几何形状和不稳定的形态差异，往往无法泛化到类人机器人上，而基于学习的方法在复杂地形上的类人移动仍然面临着巨大的挑战，原因在于稀疏的立足点奖励信号和低效的学习过程。为了应对这些挑战，我们引入了BeamDojo，这是一种专为在稀疏立足点上实现灵活动态移动而设计的强化学习 (RL) 框架。BeamDojo 首先引入了一种针对多边形足部定制的基于采样的立足点奖励，以及一个双批评家来平衡在密集移动奖励和平面稀疏立足点奖励之间的学习过程。为了促进充分的试错探索，BeamDojo 结合了一种两阶段的 RL 方法：第一阶段通过在平坦地形上训练类人机器人并为其提供任务地形感知观察，从而使地形动力学得以松弛；第二阶段在实际任务地形上进一步微调策略。此外，我们实现了基于机载 LiDAR 的高程图，以实现现实世界的部署。广泛的模拟实验和现实世界的实验表明，BeamDojo 在模拟中实现了高效的学习，并且能够在现实世界中实现精确踏步的灵活动态移动，即使在显著的外部扰动下也能保持高成功率。