LLM2D

摘要

现实环境要求机器人能够在保留之前学习技能的同时持续学习新的技能，而无需明确定义的任务边界。由于存储和隐私问题，存储所有过去数据以防止遗忘是不切实际的。为了解决这个问题，我们提出了一种方法，能够有效地恢复机器人在其整个生命周期中之前学习任务的能力。使用情景记忆 (EM)，我们的方法能够在训练期间进行经验回放，并在测试期间进行检索以进行局部微调，从而允许快速适应之前遇到的问题，而无需明确的任务标识符。此外，我们引入了一种选择性加权机制，该机制强调检索到的演示中最具挑战性的部分，将局部适应集中在最需要的地方。该框架为动态、任务感知环境中的终身学习提供了一种可扩展的解决方案，将基于检索的适应与选择性加权相结合，以增强机器人开放式场景中的性能。