LLM2D
S$^2$-扩散:从实例级到类别级技能在机器人操作中的泛化
S$^2$-Diffusion: Generalizing from Instance-level to Category-level Skills in Robot Manipulation
作者: Quantao Yang, Michael C. Welle, Danica Kragic, Olov Andersson
发布日期: 2/14/2025
arXiv ID: oai:arXiv.org:2502.09389v1

摘要

arXiv:2502.09389v1 交叉公告类型: 摘要:近期在技能学习方面的进展通过使机器人能够从实际数量的演示中学习复杂的操纵任务,将机器人操纵提升到了新的高度。然而,这些技能通常局限于训练数据中展示的具体操作、对象和环境实例,并且在转移到同一类别中的其他实例时存在困难。在本文中,我们提出了一种开放词汇量的空间语义扩散策略(S$^2$-Diffusion),该策略能够在实例级的训练数据与类别级之间实现泛化,从而使技能在相同类别的实例之间具有可转移性。我们展示了可以通过一个可提示的语义模块与空间表示相结合来捕获技能的功能方面。此外,我们提出利用深度估计网络仅使用单个RGB相机即可。我们的方法在多种机器人操纵任务上进行了评估和比较,包括模拟和真实世界环境。实验结果显示,S$^2$-Diffusion对于类别无关的因素变化具有不变性,同时还能在同一个类别中的其他实例上实现令人满意的性能,即使未对其特定实例进行训练也是如此。所有真实世界的实验视频都可以在补充材料中找到。