LLM2D
SEFE: multimodal 连续指令调优的表面和本质遗忘消除器
SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning
作者: Jinpeng Chen, Runmin Cong, Yuzhi Zhao, Hongzheng Yang, Guangneng Hu, Horace Ho Shing Ip, Sam Kwong
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.02486v1

摘要

arXiv:2505.02486v1 类型: cross 摘要: 多模态连续指令调整 (MCIT) 的目标是使多模态大型语言模型 (MLLMs) 能够在不发生灾难性遗忘的情况下逐步学习新任务。在本文中,我们探讨了在这种情况下发生的遗忘,并将其分为表面遗忘和本质遗忘。表面遗忘是指模型的知识实际上并未真正丢失,但由于后续任务答案风格的影响,其对先前任务的响应偏离了预期格式,使得结果不可用。相比之下,本质遗忘是指模型提供了格式正确但事实不准确的答案,这表明知识的真实丢失。评估本质遗忘的前提是首先解决表面遗忘,因为严重的表面遗忘可能会掩盖模型的知识状态。因此,我们首先引入了答案风格多样化 (ASD) 原理,该原理定义了一种标准化的数据样式转换过程,将不同任务的训练集统一成类似的多样化风格,以防止由风格转换引起的表面遗忘。在此基础上,我们提出了 RegLoRA 来缓解本质遗忘。RegLoRA 通过应用正则化稳定主要存储先前知识的关键参数,从而使模型能够保留现有的技能。实验结果表明,我们整体方法 SEFE 达到了最先进的性能。