摘要
arXiv:2503.18684v2 Announce Type: replace-cross
摘要:持续适应是通用自主代理的关键。例如,一个预训练了一套技能的家用机器人,仍需适应每个家庭特有的未见过的任务。受此启发,基于语言模型中的参数高效微调,先前的工作已经探索了轻量级适配器来调整预训练策略,这些适配器可以保留预训练阶段学到的特征,并表现出良好的适应性能。然而,这些方法将任务学习分开处理,限制了不同任务之间的知识迁移。在本文中,我们提出了在线元学习适配器(OMLA)。与其直接应用适配器,OMLA可以通过一个新颖的元学习目标促进先前学习任务的知识转移到当前学习任务中。在模拟和实际环境中的广泛实验表明,OMLA相比基线方法可以带来更好的适应性能。项目链接:https://ricky-zhu.github.io/OMLA/。