LLM2D
Gemma2的全参数连续预训练的弹性权重 Consolidation
Elastic Weight Consolidation for Full-Parameter Continual Pre-Training of Gemma2
作者: Vytenis \v{S}liogeris, Povilas Daniu\v{s}is, Art\=uras Nakvosas
发布日期: 5/12/2025
arXiv ID: oai:arXiv.org:2505.05946v1

摘要

arXiv:2505.05946v1 类型: cross 摘要:本文描述了一项实验,该实验从持续学习的角度出发,对包含10%立陶宛语成分的CulturaX数据集进行Gemma2 20亿参数的大语言模型(LLM)的自回归预训练。我们对模型的所有参数应用弹性权重巩固(EWC),并研究了由Arc、Belebele、Gsm8K、Hellaswag、MMLU、TruthfulQA和Winogrande(均包括英语和立陶宛语版本)集合组成的语言理解基准测试以及困惑度基准测试。实验结果表明,EWC正则化不仅可以缓解灾难性遗忘效应,还有助于使用LLM学习新任务。