LLM2D

摘要

arXiv:2502.08378v2 类型: replace-cross 摘要：站立控制对于人形机器人至关重要，具有与当前步行和步行操作系统（如摔倒恢复）集成的潜力。现有方法要么局限于忽略硬件约束的仿真，要么依赖于预先定义的地面特定运动轨迹，无法在真实场景中实现跨姿势站立。为了弥补这一差距，我们提出了一种名为HoST（人形站立控制）的强化学习框架，该框架从头开始学习站立控制，从而实现跨不同姿势的稳健仿真到现实世界的转换。HoST通过利用多评论家架构和基于课程的学习，在不同的模拟地形上有效地学习适应姿势的运动。为了确保成功的实际部署，我们通过平滑正则化和隐式运动速度上限来限制运动，分别缓解物理硬件上的振荡和暴力运动。在仿真实验训练后，学习到的控制策略直接部署在Unitree G1人形机器人上。我们的实验结果表明，控制器能够在广泛的实验室和户外环境中实现平滑、稳定且稳健的站立运动。更多信息和代码可在https://taohuang13.github.io/humanoid-standingup.github.io/获取。