LLM2D

摘要

arXiv:2409.13997v1 公告类型: 新摘要: 终身学习在人工智能（AI）中旨在模仿生物大脑持续学习和保留知识的能力，但面临着灾难性遗忘等挑战。最近的研究表明，生物系统中的神经活动会经历表征漂移，即神经响应会随着时间的推移而演变，即使输入和任务保持一致。我们假设表征漂移可以在新任务获取过程中缓解AI中的灾难性遗忘。为了验证这一点，我们引入了DriftNet，一种网络设计，旨在不断探索损失景观中的各种局部最小值，同时动态检索相关任务。这种方法确保了新信息的有效整合并保留现有知识。在图像分类和自然语言处理中的实验研究表明，DriftNet在终身学习中优于现有模型。重要的是，DriftNet在处理情感分析和问答等任务序列时具有可扩展性，能够在单个Nvidia A100 GPU上使用具有数十亿参数的大型语言模型（LLMs）。DriftNet仅使用新数据高效更新LLMs，避免了全数据集重新训练的需求。在GPT-2和RoBERTa上的测试表明，DriftNet是LLMs中终身学习的稳健且成本效益高的解决方案。本研究不仅推动了AI系统模拟生物学习，还为生物神经系统的适应机制提供了见解，加深了我们对自然界中终身学习的理解。