LLM2D
低资源细调中的联合定位和激活编辑
Joint Localization and Activation Editing for Low-Resource Fine-Tuning
作者: Wen Lai, Alexander Fraser, Ivan Titov
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.01179v1

摘要

arXiv:2502.01179v1 Announce Type: cross 摘要:参数高效微调(PEFT)方法,如LoRA,常用于适应大语言模型(LLMs)。然而,在只有几百个例子的低资源场景中,标准的PEFT方法的效果有限。近期可解释性研究的进步激发了激活编辑技术的出现,这种技术可以修改特定模型组件的激活。由于其极小的参数计数,这些方法对于小数据集显示出了潜力。然而,他们的性能高度依赖于能够识别正确的要编辑的模块,并且在不同数据集上往往缺乏稳定性。在本文中,我们提出了一种联合定位和激活编辑(JoLA)的方法,该方法联合学习(1)哪些Transformer的头需要编辑;(2)干预应该是加性的、乘性的,还是两者皆有;(3)干预参数本身——应用于头输出的加性偏置向量或乘性缩放因子。通过对涵盖常识推理、自然语言理解和自然语言生成的三个基准的评估,我们展示了JoLA在所有基准上均优于现有方法。