LLM2D
利用局部性提升机器人操作样本效率
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation
作者: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
发布日期: 9/27/2024
arXiv ID: oai:arXiv.org:2406.10615v2

摘要

鉴于在现实世界中收集机器人数据的成本很高,样本效率一直是机器人领域令人信服的追求。本文介绍了 SGRv2,这是一个模仿学习框架,通过改进的视觉和动作表示来提高样本效率。SGRv2 设计的核心是加入了一个关键的归纳偏差——动作局部性,它假设机器人的动作主要受目标物体及其与局部环境的交互影响。在模拟和现实世界环境中的大量实验表明,动作局部性对于提高样本效率至关重要。SGRv2 在使用仅 5 个演示的关键帧控制的 RLBench 任务中表现出色,并在 26 个任务中的 23 个任务中超过了 RVT 基线。此外,在使用密集控制的 ManiSkill2 和 MimicGen 上进行评估时,SGRv2 的成功率是 SGR 的 2.54 倍。在现实世界环境中,SGRv2 仅使用 8 个演示,就可以执行各种任务,并且与基线模型相比,成功率显著提高。项目网站:http://sgrv2-robot.github.io