LLM2D

摘要

arXiv:2402.17767v3 宣布类型: replace-cross 摘要：要构建能够在未见过的物体和未见过的环境中熟练操作的移动操纵系统，需要什么？本文使用展开 articulated 结构作为移动操纵的试验床来回答这一问题。具体来说，我们的重点是在没有任何先验信息的情况下完成端到端任务的表现，即机器人从能够看到新颖目标 articulated 物体的位置开始，然后接近物体并成功打开它。我们首先为此任务开发了一个系统，然后在13个实际测试地点进行了100多次端到端系统测试。我们的大规模研究揭示了一些令人惊讶的发现：a) 在此任务上，模块化系统表现优于端到端学习系统，即使端到端学习系统在1000多次示范的基础上进行训练，b) 感知，而非精确末端执行器控制，是任务成功的主要瓶颈，c) 在单独开发的状态-of-艺术展开参数估计模型在面对以机器人为中心的视角时表现不佳。总体而言，我们的研究结果强调了隔离开发管道组件的局限性，并强调了系统级研究的必要性，为构建可推广的移动操纵系统提供了一条实用的道路。该项目网站上提供了视频、代码和模型：https://arjung128.github.io/opening-articulated-structures/