LLM2D
ZJUKLAB参加SemEval-2025任务4:通过模型融合实现遗忘
ZJUKLAB at SemEval-2025 Task 4: Unlearning via Model Merging
作者: Haoming Xu, Shuxun Wang, Yanqiu Zhao, Yi Zhong, Ziyan Jiang, Ningyuan Zhao, Shumin Deng, Huajun Chen, Ningyu Zhang
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.21088v1

摘要

arXiv:2503.21088v1 交叉公告类型 摘要:本文介绍了ZJUKLAB团队在SemEval-2025任务4中的提交,该任务旨在从大型语言模型中选择性地删除敏感知识,避免过度遗忘和不足遗忘的问题。我们提出了一种利用模型合并(具体是TIES-Merging)的遗忘系统,将两个专业模型合并为一个更平衡的遗忘模型。我们的系统取得了竞争性的结果,在26支队伍中排名第二,Task Aggregate的在线得分为0.944,总体Aggregate得分为0.487。在本文中,我们还进行了局部实验,并对遗忘过程进行了全面分析,考察了性能轨迹、损失动态和权重视角,以及一些补充实验,以理解我们方法的有效性。此外,我们分析了我们方法和评估指标的局限性,强调仅凭MIA得分和基于ROUGE的指标不足以全面评估成功的遗忘。最后,我们强调在未来的研究中需要更全面的评估方法论,并重新思考遗忘目标的重要性。代码可在https://github.com/zjunlp/unlearn/tree/main/semeval25获取。