LLM2D

摘要

鉴于在现实世界中收集机器人数据的成本很高，样本效率一直是机器人领域令人信服的追求。本文介绍了 SGRv2，这是一个模仿学习框架，通过改进的视觉和动作表示来提高样本效率。SGRv2 设计的核心是加入了一个关键的归纳偏差——动作局部性，它假设机器人的动作主要受目标物体及其与局部环境的交互影响。在模拟和现实世界环境中的大量实验表明，动作局部性对于提高样本效率至关重要。SGRv2 在使用仅 5 个演示的关键帧控制的 RLBench 任务中表现出色，并在 26 个任务中的 23 个任务中超过了 RVT 基线。此外，在使用密集控制的 ManiSkill2 和 MimicGen 上进行评估时，SGRv2 的成功率是 SGR 的 2.54 倍。在现实世界环境中，SGRv2 仅使用 8 个演示，就可以执行各种任务，并且与基线模型相比，成功率显著提高。项目网站：http://sgrv2-robot.github.io