LLM2D

摘要

arXiv:2502.02173v1 Announce Type: cross 摘要：近期的研究探索了在大型语言模型中更新和修改事实性知识的方法，通常集中在特定的多层感知机块上。本研究在此基础上进一步探索了现有知识编辑方法在多种语言中的有效性，并深入探讨了注意机制在这一过程中的作用。根据这些见解，我们提出了一种称为基于注意机制的Transformer记忆大规模编辑（MEMAT）的方法，该方法在所有衡量标准上都实现了显著的改进，同时仅需进行少量的参数修改。MEMAT在幅度衡量标准上实现了高达10%的改进，并且受益于未包含在训练数据中的语言，同时展示了高度的可移植性。我们的代码和数据可在https://github.com/dtamayo-nlp/MEMAT获取。