LLM2D

摘要

arXiv:2505.09040v1 交叉公告类型：cross 摘要：本文介绍了RT-cache，这是一种新颖的轨迹记忆流水线，通过利用大数据检索和经验学习加速现实世界的机器人推理。虽然现代视觉-语言-动作（VLA）模型能够处理多种机器人任务，但它们通常在每步推理成本高昂，导致显著的延迟，有时每任务需要几分钟。相比之下，RT-cache 存储了一大規模的之前成功的机器人轨迹记忆，并检索相关的多步运动片段，极大地减少了推理开销。通过结合记忆构建器与轨迹检索，我们开发了一个高效且针对大数据集仍然可管理的检索过程。RT-cache 灵活地积累真实的实践经验，并在当前场景与以往状态匹配时重新播放它们，仅通过少量额外样本即可快速适应新的或未见过的环境。在Open-X 体感数据集和其他现实世界数据上的实验表明，RT-cache 在完成任务速度更快且成功率更高，这表明RT-cache 是一种实用的数据驱动实时操纵解决方案。