LLM2D

摘要

arXiv:2505.04787v1 宣布类型:交叉摘要:连续学习涉及从新数据中逐步获取知识，同时保留之前获取的知识，从而缓解神经网络中的“灾难性遗忘”问题。我们的工作提出了一种新的基于不确定性驱动的无监督连续学习框架，名为“回忆以记住（R2R）”。提出的R2R架构通过聚类级别的不确定性驱动反馈机制和VLM增强的生成回忆模块，高效地平衡使用未标记和合成标记数据。不同于依赖预训练模型和伪标签的传统记忆缓冲方法，我们的R2R框架不需要任何先期训练。它利用未标记数据的视觉特征，并通过基于聚类的不确定性估算结合动态阈值进行连续适应。同时，生成回忆机制与使用DeepSeek-R1增强的CLIP VLM一起产生代表过往经验的标记合成数据，类似于生物视觉思维通过回忆记忆来执行新、未见过的任务。在CIFAR-10、CIFAR-100、CINIC-10、SVHN和TinyImageNet数据集上进行了大量实验分析。我们提出的R2R方法提高了知识保留，分别达到了98.13%、73.06%、93.41%、95.18%、59.74%的性能，超过当前最佳性能超过4.36%。