LLM2D

摘要

arXiv:2505.10457v1 类型: cross 摘要: 逐增量学习是一种机器学习范式，其中模型从依次流式的任务中学习。这一设置提出了一个关键挑战：平衡可塑性（学习新任务）和稳定性（保留过往知识）。神经架构搜索（NAS），作为自动化机器学习（AutoML）的一个分支，自动设计深度神经网络的架构，并在静态设置中显示出成功。然而，现有的基于NAS的方法在增量学习中通常依赖于每次任务都扩展模型，使得它们在资源受限的环境下不切实际。在本文中，我们介绍了SEAL，这是一种针对数据增量学习的NAS基础框架，这是一种不存储未来访问的数据样本的场景下，离散的数据样本依次到达。SEAL动态适应模型结构，仅在必要时扩展，基于一个容量估计指标。通过在每次扩展步骤后的交叉蒸馏训练来保持稳定性。NAS组件协同搜索最优架构和扩展策略。在多个基准测试中的实验表明，SEAL有效减少了遗忘并提高了准确性，同时保持了更低的模型大小，相比先前的方法。这些结果突显了结合NAS和选择性扩展在增量场景中实现高效、自适应学习的前景。