摘要
arXiv:2503.21088v1 交叉公告类型
摘要:本文介绍了ZJUKLAB团队在SemEval-2025任务4中的提交,该任务旨在从大型语言模型中选择性地删除敏感知识,避免过度遗忘和不足遗忘的问题。我们提出了一种利用模型合并(具体是TIES-Merging)的遗忘系统,将两个专业模型合并为一个更平衡的遗忘模型。我们的系统取得了竞争性的结果,在26支队伍中排名第二,Task Aggregate的在线得分为0.944,总体Aggregate得分为0.487。在本文中,我们还进行了局部实验,并对遗忘过程进行了全面分析,考察了性能轨迹、损失动态和权重视角,以及一些补充实验,以理解我们方法的有效性。此外,我们分析了我们方法和评估指标的局限性,强调仅凭MIA得分和基于ROUGE的指标不足以全面评估成功的遗忘。最后,我们强调在未来的研究中需要更全面的评估方法论,并重新思考遗忘目标的重要性。代码可在https://github.com/zjunlp/unlearn/tree/main/semeval25获取。