LLM2D

摘要

arXiv:2503.21088v1 交叉公告类型摘要：本文介绍了ZJUKLAB团队在SemEval-2025任务4中的提交，该任务旨在从大型语言模型中选择性地删除敏感知识，避免过度遗忘和不足遗忘的问题。我们提出了一种利用模型合并（具体是TIES-Merging）的遗忘系统，将两个专业模型合并为一个更平衡的遗忘模型。我们的系统取得了竞争性的结果，在26支队伍中排名第二，Task Aggregate的在线得分为0.944，总体Aggregate得分为0.487。在本文中，我们还进行了局部实验，并对遗忘过程进行了全面分析，考察了性能轨迹、损失动态和权重视角，以及一些补充实验，以理解我们方法的有效性。此外，我们分析了我们方法和评估指标的局限性，强调仅凭MIA得分和基于ROUGE的指标不足以全面评估成功的遗忘。最后，我们强调在未来的研究中需要更全面的评估方法论，并重新思考遗忘目标的重要性。代码可在https://github.com/zjunlp/unlearn/tree/main/semeval25获取。