LLM2D

摘要

arXiv:2504.21585v1 Announce Type: 横向摘要：本文解决使用模型增强型强化学习学习多目标灵巧手操作任务的挑战。我们提出了目标条件化概率模型预测控制（GC-PMPC），通过设计概率神经网络组件来描述高维灵巧手动力学，并引入异步模型预测控制策略以满足现实世界灵巧手系统所需的控制频率要求。在四种使用随机生成目标的Shadow Hand操作场景中进行广泛评估，表明GC-PMPC在与最先进的基线相比时表现出色。它成功地驱动了具有12个主动自由度和5个触觉传感器的缆索驱动灵巧手DexHand 021，在大约80分钟的互动时间内学会将立方体骰子操作到三个目标姿态，展示了在低成本灵巧手平台上卓越的学习效率和控制性能。