LLM2D

摘要

arXiv:2410.03955v4 宣布类型: replace-cross 摘要：在现实世界的应用中，学习驱动的系统经常通过迭代的模型开发来应对具有挑战性或新兴的任务，这涉及收集新数据、训练新模型和验证模型。这一持续的模型开发过程引发了显著的问题，即在获取新能力或改进现有能力时，可能会无意中失去旧模型的优良能力，这也被称为灾难性遗忘。虽然现有的持续学习旨在通过在先前任务和新任务之间权衡性能来减轻灾难性遗忘，以确保良好的平均性能，但在成本敏感的应用中，它往往无法满足要求，未能保存关键的既定能力会导致未预见的成本和风险，以及重新改善这些能力所需的大量支出。为了解决这一问题，我们要求学习系统确保新模型严格保留旧模型的重要能力的同时，提高目标任务的性能，我们将其称为模型开发安全性。为了确保模型开发安全性，我们提出了一种以保留为核心框架，并带有数据依赖性约束的方法，并研究如何持续开发预训练的CLIP模型，以获取或改进图像分类的能力。我们提出了一种高效且有理论保证的约束优化算法，并利用其见解对具有任务依赖性头的CLIP模型进行微调，以促进模型开发安全性。在自动驾驶和场景识别数据集上的实验验证了我们方法的有效性。