LLM2D

摘要

arXiv:2410.02355v4 宣告类型: replace-cross 摘要: 大型语言模型（LLMs）常常由于不正确的或过时的知识而表现出幻觉。因此，已经出现了模型编辑方法来实现有针对性的知识更新。为了实现这一点，当前流行的方法是定位-然后编辑方法，它首先定位有影响力的参数，然后通过引入扰动来编辑它们。虽然这种方法有效，但当前的研究已经证明，这种扰动不可避免地会破坏LLMs中保留的知识，尤其是连续编辑场景中。为了解决这一问题，我们引入了AlphaEdit，这是一种新颖的解决方案，在应用到参数之前，将扰动投影到保留知识的零空间。我们从理论上证明了这种投影确保在查询保留知识时，编辑后的LLMs的输出保持不变，从而减轻了扰动带来的问题。在各种LLMs上的广泛实验，包括LLaMA3、GPT2-XL和GPT-J，表明，通过在投影代码上添加一行额外的代码，AlphaEdit可以提高大多数定位-然后编辑方法的性能，平均提升36.7%。我们的代码可以在以下链接获取：https://github.com/jianghoucheng/AlphaEdit。