LLM2D
基于 GRFM-Net 的双足运动 MPC 自动调优,实现高效的仿真到真实迁移
Autotuning Bipedal Locomotion MPC with GRFM-Net for Efficient Sim-to-Real Transfer
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2409.15710v1

摘要

双足行走控制对于人形机器人导航复杂的人类中心环境至关重要。虽然基于优化的控制设计在整合人形机器人的复杂模型方面很受欢迎,但它们通常需要费力的手动调优。在这项工作中,我们使用 DiffTune 解决了双足行走控制中参数选择带来的挑战,DiffTune 是一种基于模型的自动调优方法,利用微分编程进行高效的参数学习。一个主要困难在于平衡模型保真度和可微分性。我们使用低保真度模型来解决可微分性问题,并通过地面反作用力-力矩网络 (GRFM-Net) 来增强模型,以捕捉 MPC 命令与实际控制效果之间的差异。我们在硬件实验中验证了 DiffTune 与 GRFM-Net 共同学习的参数,结果表明,与基线参数相比,这些参数在多目标环境中具有最优性,与专家调优的参数相比,总损失降低了高达 40.5%。结果证实了 GRFM-Net 在减轻仿真到现实差距方面的有效性,提高了仿真学习参数到真实硬件的可迁移性。