摘要
arXiv:2409.13997v1 公告类型: 新 摘要: 终身学习在人工智能(AI)中旨在模仿生物大脑持续学习和保留知识的能力,但面临着灾难性遗忘等挑战。最近的研究表明,生物系统中的神经活动会经历表征漂移,即神经响应会随着时间的推移而演变,即使输入和任务保持一致。我们假设表征漂移可以在新任务获取过程中缓解AI中的灾难性遗忘。为了验证这一点,我们引入了DriftNet,一种网络设计,旨在不断探索损失景观中的各种局部最小值,同时动态检索相关任务。这种方法确保了新信息的有效整合并保留现有知识。在图像分类和自然语言处理中的实验研究表明,DriftNet在终身学习中优于现有模型。重要的是,DriftNet在处理情感分析和问答等任务序列时具有可扩展性,能够在单个Nvidia A100 GPU上使用具有数十亿参数的大型语言模型(LLMs)。DriftNet仅使用新数据高效更新LLMs,避免了全数据集重新训练的需求。在GPT-2和RoBERTa上的测试表明,DriftNet是LLMs中终身学习的稳健且成本效益高的解决方案。本研究不仅推动了AI系统模拟生物学习,还为生物神经系统的适应机制提供了见解,加深了我们对自然界中终身学习的理解。