LLM2D
SEAL: 搜索可扩展架构以实现增量学习
SEAL: Searching Expandable Architectures for Incremental Learning
作者: Matteo Gambella, Vicente Javier Castro Solar, Manuel Roveri
发布日期: 5/16/2025
arXiv ID: oai:arXiv.org:2505.10457v1

摘要

arXiv:2505.10457v1 类型: cross 摘要: 逐增量学习是一种机器学习范式,其中模型从依次流式的任务中学习。这一设置提出了一个关键挑战:平衡可塑性(学习新任务)和稳定性(保留过往知识)。神经架构搜索(NAS),作为自动化机器学习(AutoML)的一个分支,自动设计深度神经网络的架构,并在静态设置中显示出成功。然而,现有的基于NAS的方法在增量学习中通常依赖于每次任务都扩展模型,使得它们在资源受限的环境下不切实际。在本文中,我们介绍了SEAL,这是一种针对数据增量学习的NAS基础框架,这是一种不存储未来访问的数据样本的场景下,离散的数据样本依次到达。SEAL动态适应模型结构,仅在必要时扩展,基于一个容量估计指标。通过在每次扩展步骤后的交叉蒸馏训练来保持稳定性。NAS组件协同搜索最优架构和扩展策略。在多个基准测试中的实验表明,SEAL有效减少了遗忘并提高了准确性,同时保持了更低的模型大小,相比先前的方法。这些结果突显了结合NAS和选择性扩展在增量场景中实现高效、自适应学习的前景。