LLM2D
MOSAIC:一种以技能为中心的长期操作规划算法框架
MOSAIC: A Skill-Centric Algorithmic Framework for Long-Horizon Manipulation Planning
作者: Itamar Mishani, Yorai Shaoul, Maxim Likhachev
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2504.16738v1

摘要

arXiv:2504.16738v1 类别:交叉学科 摘要:使用一组预定义技能来规划长期任务是机器人技术与人工智能领域的关键挑战。解决这一挑战需要系统地探索技能组合的方法,以发现任务解决序列,利用通用且易于学习的技能(例如推动和抓取)来泛化到未见过的任务,并避免依赖需要广泛领域和任务特定知识的符号世界表示。尽管取得了显著的进展,但这些要素在现有方法中仍然主要分开,留下了在实现对复杂、长期问题的强大、可扩展解决方案方面的重要缺口。在本工作中,我们提出了MOSAIC,这是一种以技能为中心的框架,通过使用技能本身来引导规划过程来统一这些要素。MOSAIC 使用两种类型的技能:生成器计算可执行轨迹和世界配置,而连接器通过解决边界值问题将这些独立生成的技能轨迹连接起来,从而使任务的完成成为可能。通过摆脱从预定义的起始或目标状态逐步发现技能的传统范式——这种限制极大地限制了探索——MOSAIC 将规划努力集中在技能本身有效的工作区域上。我们在模拟和实际机器人操作任务中展示了MOSAIC 的有效性,展示了其利用生成扩散模型、运动规划算法和特定于操作的模型来解决复杂长期规划问题的能力。访问 https://skill-mosaic.github.io 获取演示和示例。