LLM2D

摘要

机器人模仿学习由于机器人环境的复杂性和数据收集的高成本，在泛化方面面临着巨大的挑战。我们引入了RoCoDA，这是一种新颖的方法，它在一个框架内统一了不变性、等变性和因果关系的概念，以增强模仿学习的数据增强。RoCoDA通过修改与任务无关的环境状态子集而不影响策略的输出，从而利用因果不变性。同时，我们通过对物体姿态应用刚体变换并调整相应的动作来生成合成演示，从而利用SE(3)等变性。我们在五个机器人操作任务上进行了广泛的实验来验证RoCoDA，结果表明，与最先进的数据增强方法相比，它提高了策略性能、泛化能力和样本效率。我们的策略对看不见的物体姿态、纹理和干扰物的存在表现出强大的泛化能力。此外，我们观察到诸如重新抓取之类的涌现行为，这表明用RoCoDA训练的策略对任务动力学有更深入的理解。通过利用不变性、等变性和因果关系，RoCoDA为模仿学习中的数据增强提供了一种有原则的方法，弥合了几何对称性和因果推理之间的差距。