摘要
arXiv:2505.09040v1 交叉公告类型:cross
摘要:本文介绍了RT-cache,这是一种新颖的轨迹记忆流水线,通过利用大数据检索和经验学习加速现实世界的机器人推理。虽然现代视觉-语言-动作(VLA)模型能够处理多种机器人任务,但它们通常在每步推理成本高昂,导致显著的延迟,有时每任务需要几分钟。相比之下,RT-cache 存储了一大規模的之前成功的机器人轨迹记忆,并检索相关的多步运动片段,极大地减少了推理开销。通过结合记忆构建器与轨迹检索,我们开发了一个高效且针对大数据集仍然可管理的检索过程。RT-cache 灵活地积累真实的实践经验,并在当前场景与以往状态匹配时重新播放它们,仅通过少量额外样本即可快速适应新的或未见过的环境。在Open-X 体感数据集和其他现实世界数据上的实验表明,RT-cache 在完成任务速度更快且成功率更高,这表明RT-cache 是一种实用的数据驱动实时操纵解决方案。