摘要
arXiv:2502.08378v2 类型: replace-cross
摘要:站立控制对于人形机器人至关重要,具有与当前步行和步行操作系统(如摔倒恢复)集成的潜力。现有方法要么局限于忽略硬件约束的仿真,要么依赖于预先定义的地面特定运动轨迹,无法在真实场景中实现跨姿势站立。为了弥补这一差距,我们提出了一种名为HoST(人形站立控制)的强化学习框架,该框架从头开始学习站立控制,从而实现跨不同姿势的稳健仿真到现实世界的转换。HoST通过利用多评论家架构和基于课程的学习,在不同的模拟地形上有效地学习适应姿势的运动。为了确保成功的实际部署,我们通过平滑正则化和隐式运动速度上限来限制运动,分别缓解物理硬件上的振荡和暴力运动。在仿真实验训练后,学习到的控制策略直接部署在Unitree G1人形机器人上。我们的实验结果表明,控制器能够在广泛的实验室和户外环境中实现平滑、稳定且稳健的站立运动。更多信息和代码可在https://taohuang13.github.io/humanoid-standingup.github.io/获取。