LLM2D

摘要

arXiv:2405.08726v2 种类更新：替换交叉摘要：类人机器人有可能以高度视觉保真度模仿人类动作，但将这些动作转化为实际的物理执行仍然是一个重大挑战。图形领域现有的技术往往优先考虑视觉保真度而非物理基础的可行性，这给实用应用中部署两足系统带来了重大挑战。本文通过有界残差强化学习解决了这些问题，从而产生基于物理的高质量运动模仿，这些模仿不仅增强了动作相似性，还能成功跟随参考的人类轨迹。我们的框架，基于有界残差强化学习的类人机器人控制与模仿（I-CTRL），将运动模仿重新定义为不对物理基础进行重新目标化的约束调整。I-CTRL通过简单的独特奖励在五个机器人上实现了运动模仿的泛化。此外，我们的框架引入了一个自动优先级调度器，在高效训练跨不同动作的统一RL策略时管理大规模动作数据集。提出的这种方法是推进两足机器人控制的关键性一步，强调了视觉和物理真实性的对齐在成功运动模仿中的重要性。