LLM2D

摘要

机器遗忘学习 (MU) 已经出现，旨在增强深度神经网络的隐私和可信度。近似 MU 是一种适用于大型模型的实用方法。我们对近似 MU 的研究从识别最速下降方向开始，在参数邻域内最小化输出 Kullback-Leibler 散度以达到精确的 MU。这个探测方向分解为三个部分：加权遗忘梯度上升、微调保留梯度下降和权重显著性矩阵。这种从欧几里得度量导出的分解包含了大多数现有的基于梯度的 MU 方法。然而，坚持欧几里得空间可能会导致次优的迭代轨迹，因为忽略了输出概率空间的几何结构。我们建议将遗忘更新嵌入到由剩余几何结构渲染的流形中，并结合来自剩余数据的二阶 Hessian 矩阵。这有助于防止有效遗忘干扰保留的性能。然而，为大型模型计算二阶 Hessian 矩阵是不可行的。为了有效地利用 Hessian 调制的优势，我们提出了一种快慢参数更新策略来隐式逼近最新的显著遗忘方向。我们的方法不受特定模态约束的限制，适用于计算机视觉遗忘任务，包括分类和生成。大量的实验验证了我们的有效性和效率。值得注意的是，我们的方法成功地在 ImageNet 上使用 DiT 执行了类别遗忘，并在 CIFAR-10 上使用 DDPM 遗忘了一个类别，只需 50 步，而以前的方法需要数千步。