LLM2D

摘要

arXiv:2503.22634v1 类型: cross 摘要：在机器人学的模拟学习中，使用在模拟和真实硬件上生成的演示数据进行协同训练已成为克服模拟到现实差距的强大方法。本文旨在阐明这种模拟与现实协同训练的基本原理，以帮助设计模拟环境、创建模拟与现实的数据集以及训练策略。我们将研究集中在平面推物体这一经典任务上，通过来自摄像头的输入，使我们能够在研究中做到详尽无遗。这些实验证实，与模拟数据进行协同训练可以显著提高在真实环境中的性能，尤其是在真实数据有限的情况下。随着模拟数据的增加，性能提升会逐渐达到 plateau；而真实世界的数据会提高这一性能上限。此外，结果还表明，对于非抓握性操作任务，减少物理学领域的差距可能比提高视觉保真度更为重要。令人惊讶的是，存在一定的视觉领域差距实际上有助于协同训练策略——二进制探针显示，高性能策略学会了区分模拟域与真实环境。最后，我们探讨了这种细微差别以及促进模拟与现实之间正向迁移的机制。总共，我们的实验涵盖了超过40个真实世界策略（在800多次试验中评估）和200个模拟策略（在4万多次试验中评估）。