LLM2D

摘要

arXiv:2410.06331v3 通告类型: replace-cross 摘要：定位-编辑范式在大型语言模型（LLMs）的知识编辑（KE）中显示出了显著的潜力。尽管以前的方法在单跳事实回忆任务上表现良好，但在涉及新编辑知识的多跳事实回忆任务中却一直表现不佳。在本文中，利用机制可解释性工具，我们首先发现，在多跳任务中，LLMs往往会从较深的MLP层中检索具有隐式主语信息的知识，而在单跳任务中，则依赖于浅层结构。这一区别解释了当前方法在多跳查询中的表现不佳，因为它们主要集中在使用单跳编辑提示编辑浅层结构，而让更深的层保持不变。为解决这个问题，我们提出了一种新的定位-编辑KE方法IFMET，旨在编辑浅层和深层MLP层。IFMET进一步引入了多跳编辑提示，以在推理的不同阶段定位和修改知识。实验结果表明，IFMET显著提高了在多跳事实回忆任务上的表现，克服了之前定位-编辑方法的局限性。