LLM2D

摘要

arXiv:2502.12959v1 宣布类型: 交叉摘要: 重新对齐技术经常被用来增强多语言语言模型中的跨语言迁移，但仍有时会在与微调源语言差异极大的语言中降低性能。本文介绍了一种名为AlignFreeze的方法，该方法在重新对齐过程中冻结每一层的下半部分或上半部分。通过在4项任务、3个模型和35种语言上进行受控实验，我们发现重新对齐会影响所有层，但对下层的影响尤为显著。冻结下层可以防止性能下降。特别是，AlignFreeze在重新对齐失败的语言中提高了词性标注性能：与XLM-R相比，它在7种更多语言上的准确率改进超过了一个标准差。