LLM2D

摘要

arXiv:2505.06218v1 交叉公告类型摘要：在复杂的山径上徒步要求具备平衡、敏捷性和适应性决策能力。当前的人形机器人研究在这方面仍然碎片化且不足：行走主要关注于运动技能，缺乏长期目标或环境意识，而语义导航则忽略了实际世界中的身体存在和局部地形的变异性。我们提出训练人形机器人在复杂的山径上行走，以促进视觉感知、决策和运动执行的综合技能发展。我们开发了一种学习框架LEGO-H，使配备视觉的机器人能够在复杂山径上自主徒步。我们介绍两项技术创新：1）一种时间视变体转换器变种—集成到层次强化学习框架中—预测未来局部目标以引导运动，无缝地将移动与目标导向导航结合。2）关节运动模式的潜在表示结合分层度量学习—增强特权学习方案—使从特权训练到实时执行的策略传递变得平滑。这些组件使LEGO-H能够在不依赖预定义运动模式的情况下应对各种物理和环境挑战。不同模拟山径和机器人形态的实验突显了LEGO-H的多功能性和鲁棒性，将其定位为体现自主性测试的良好平台，并将LEGO-H作为未来人形机器人发展的基准。