LLM2D
扩散与选项:面向时间扩展任务的分层生成技能组合
Diffusion Meets Options: Hierarchical Generative Skill Composition for Temporally-Extended Tasks
作者: Zeyu Feng, Hao Luan, Kevin Yuchen Ma, Harold Soh
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2410.02389v1

摘要

安全且成功地部署机器人不仅需要生成复杂计划的能力,还需要频繁地重新规划和纠正执行错误的能力。本文针对在后退视界方式下,在时间扩展目标下进行长时域轨迹规划的挑战。为此,我们提出了 DOPPLER,一个数据驱动的分层框架,它基于线性时序逻辑 (LTL) 指定的指令生成和更新计划。我们的方法将时间任务分解成具有离线非专家数据集的层次强化学习的选项链。它利用扩散模型来生成具有低级动作的选项。我们在批次生成期间设计了一种行列式引导的后验采样技术,这提高了扩散生成的选项的速度和多样性,从而导致更有效的查询。在机器人导航和操作任务上的实验表明,DOPPLER 可以生成一系列轨迹,这些轨迹逐渐满足指定的避免障碍物和顺序访问的公式。演示视频可在以下网址在线获取:https://philiptheother.github.io/doppler/。