LLM2D
无需对齐冻结:探索真实对齐影响多语言模型各层的作用 Across 不同语言
AlignFreeze: Navigating the Impact of Realignment on the Layers of Multilingual Models Across Diverse Languages
作者: Steve Bakos, F\'elix Gaschi, David Guzm\'an, Riddhi More, Kelly Chutong Li, En-Shiun Annie Lee
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2502.12959v1

摘要

arXiv:2502.12959v1 宣布类型: 交叉 摘要: 重新对齐技术经常被用来增强多语言语言模型中的跨语言迁移,但仍有时会在与微调源语言差异极大的语言中降低性能。本文介绍了一种名为AlignFreeze的方法,该方法在重新对齐过程中冻结每一层的下半部分或上半部分。通过在4项任务、3个模型和35种语言上进行受控实验,我们发现重新对齐会影响所有层,但对下层的影响尤为显著。冻结下层可以防止性能下降。特别是,AlignFreeze在重新对齐失败的语言中提高了词性标注性能:与XLM-R相比,它在7种更多语言上的准确率改进超过了一个标准差。