LLM2D

摘要

arXiv:2503.18684v1 宣布类型: cross 摘要：持续适应对于通用自主代理是必不可少的。例如，一个在一系列技能上进行预训练的家庭机器人，仍然需要适应每个家庭特有的未见过的任务。受此启发，在构建于语言模型参数高效微调之上，先前的工作已经探索了轻量级适配器来适应预训练策略，这些适配器可以在保持预训练阶段学到的功能的同时，表现出良好的适应性能。然而，这些方法将任务学习分开处理，限制了任务之间的知识转移。在本文中，我们提出了一种在线元学习适配器 (OMLA)。与直接应用适配器不同，OMLA 可通过一种新型的元学习目标，促进先前学习任务的知识在当前学习任务中的转移。在模拟环境和现实世界环境中的大量实验结果表明，OMLA 相较于基线方法可以实现更好的适应性能。项目链接: https://ricky-zhu.github.io/OMLA/。