LLM2D
基于梯度的统一机器遗忘学习,并增强剩余几何结构
Unified Gradient-Based Machine Unlearning with Remain Geometry Enhancement
作者: Zhehao Huang, Xinwen Cheng, JingHao Zheng, Haoran Wang, Zhengbao He, Tao Li, Xiaolin Huang
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19732v1

摘要

机器遗忘学习 (MU) 已经出现,旨在增强深度神经网络的隐私和可信度。近似 MU 是一种适用于大型模型的实用方法。我们对近似 MU 的研究从识别最速下降方向开始,在参数邻域内最小化输出 Kullback-Leibler 散度以达到精确的 MU。这个探测方向分解为三个部分:加权遗忘梯度上升、微调保留梯度下降和权重显著性矩阵。这种从欧几里得度量导出的分解包含了大多数现有的基于梯度的 MU 方法。然而,坚持欧几里得空间可能会导致次优的迭代轨迹,因为忽略了输出概率空间的几何结构。我们建议将遗忘更新嵌入到由剩余几何结构渲染的流形中,并结合来自剩余数据的二阶 Hessian 矩阵。这有助于防止有效遗忘干扰保留的性能。然而,为大型模型计算二阶 Hessian 矩阵是不可行的。为了有效地利用 Hessian 调制的优势,我们提出了一种快慢参数更新策略来隐式逼近最新的显著遗忘方向。我们的方法不受特定模态约束的限制,适用于计算机视觉遗忘任务,包括分类和生成。大量的实验验证了我们的有效性和效率。值得注意的是,我们的方法成功地在 ImageNet 上使用 DiT 执行了类别遗忘,并在 CIFAR-10 上使用 DDPM 遗忘了一个类别,只需 50 步,而以前的方法需要数千步。