LLM2D

摘要

arXiv:2505.04787v2 宣告类型: replace-cross 摘要：连续学习涉及逐步从新数据中获取知识，同时保留之前获取的知识，从而减轻神经网络中的“灾难性遗忘”。我们的工作提出了一种新颖的以不确定性驱动的无监督连续学习框架，名为“重放以铭记（R2R）”。提出的R2R架构通过聚类级别的不确定性驱动反馈机制和基于VLM的生成性重放模块，高效地使用未标记和合成标记数据，比例平衡。与依赖预训练模型和伪标签的传统记忆缓冲方法不同，我们的R2R框架无需任何先前训练即可运行。它利用未标记数据的视觉特征，并通过基于聚类的不确定性估计结合动态阈值不断进行适应。同时，一种生成性重放机制与使用DeepSeek-R1增强的CLIP VLM结合，产生代表过去经验的标记合成数据，类似于生物视觉思维，通过重放记忆来记住并在新的、未见的任务中采取行动。我们在CIFAR-10、CIFAR-100、CINIC-10、SVHN和TinyImageNet数据集中进行了广泛的经验分析。我们提出的R2R方法提高了知识保留，分别实现了98.13%、73.06%、93.41%、95.18%、59.74%的最佳性能，超过现有最佳性能4.36%以上。