LLM2D

摘要

arXiv:2410.02995v3 通知类型: replace-cross 摘要：智能机器人领域的一个基本目标是朝着能够随着时间学习和适应未见过的新场景的终身学习机器人发展。然而，持续学习新任务会由于数据分布的变化而导致灾难性遗忘问题。为了缓解这一问题，我们存储了之前任务的一部分数据，并以两种方式利用这些数据：利用经验回放来保留学到的技能，并应用一种新的基于检索的局部适应技术来恢复相关知识。由于终身学习的机器人必须在未指定任务的场景中操作，其中任务ID甚至边界根本不可用，因此我们的方法在不依赖这些信息的情况下仍然能够有效运行。我们还引入了选择性加权机制，专注于最“遗忘”的技能段，以确保有效的知识恢复。针对各种各样的操作任务的实验结果表明，我们的框架为终身学习提供了可扩展的范式，在开放性、未指定任务的场景中提升了机器人的性能。