LLM2D

摘要

arXiv:2504.18437v1 提交类型: cross 摘要: 类增量学习(CIL)是现实世界应用中的一个关键能力，使学习系统能够在适应新任务的同时保留先前知识。最近预训练模型(PTM)的进步显著推动了CIL领域的发展，显示出在传统方法上更优越的性能。然而，如何理解特征在增量任务中的演变和分布仍是一个开放的挑战。在本文中，我们提出了一种通过神经坍缩(NC)的新颖方法来建模基于PTM的CIL中的特征演变，神经坍缩是一种在训练后期观察到的引人注目的现象，导致特征空间充分分离且等角。我们探讨了NC与CIL有效性之间的联系，表明将特征分布与NC几何结构对齐可以增强捕捉连续学习动态行为的能力。基于这一见解，我们引入了神经坍缩启发式的基于PTM的CIL(NCPTM-CIL)方法，该方法动态调整特征空间以符合优美的NC结构，从而增强连续学习过程。广泛的实验表明，NCPTM-CIL在四个基准数据集上优于最先进的方法。值得注意的是，在使用ViT-B/16-IN1K初始化时，NCPTM-CIL在VTAB上的表现超过第二名方法6.73%，在CIFAR-100上的表现超过2.5%，在泛化基准上超过1.25%。