LLM2D

摘要

arXiv:2502.08378v1 交叉公告类型: 摘要：站立控制对于类人机器人至关重要，具有与当前的步态和步态操作系统（如摔倒恢复）集成的潜在价值。现有的方法要么局限于忽略硬件限制的仿真，要么依赖于预定义的特定地面运动轨迹，无法在现实场景中实现多种姿态的站立。为了解决这一问题，我们提出了HoST（类人站立控制），这是一种从头学习站立控制的强化学习框架，使站立控制能够在多种姿态下实现稳健的模拟到现实的转移。HoST通过利用多评论家架构和基于课程的训练方法高效地学习适应不同姿态的运动。为了确保现实世界部署的成功，我们通过平滑性正则化和隐式运动速度约束限制运动，分别减轻物理硬件上的振荡和暴力运动。在模拟训练后，学习到的控制策略直接部署在Unitree G1类人机器人上。我们的实验结果表明，这些控制器在广泛实验室和户外环境中实现了平滑、稳定且稳健的站立运动。更多视频请参阅 https://taohuang13.github.io/humanoid-standingup.github.io/。