摘要
arXiv:2503.18684v1 宣布类型: cross
摘要:持续适应对于通用自主代理是必不可少的。例如,一个在一系列技能上进行预训练的家庭机器人,仍然需要适应每个家庭特有的未见过的任务。受此启发,在构建于语言模型参数高效微调之上,先前的工作已经探索了轻量级适配器来适应预训练策略,这些适配器可以在保持预训练阶段学到的功能的同时,表现出良好的适应性能。然而,这些方法将任务学习分开处理,限制了任务之间的知识转移。在本文中,我们提出了一种在线元学习适配器 (OMLA)。与直接应用适配器不同,OMLA 可通过一种新型的元学习目标,促进先前学习任务的知识在当前学习任务中的转移。在模拟环境和现实世界环境中的大量实验结果表明,OMLA 相较于基线方法可以实现更好的适应性能。项目链接: https://ricky-zhu.github.io/OMLA/。