LLM2D

摘要

arXiv:2505.05946v1 类型: cross 摘要：本文描述了一项实验，该实验从持续学习的角度出发，对包含10%立陶宛语成分的CulturaX数据集进行Gemma2 20亿参数的大语言模型（LLM）的自回归预训练。我们对模型的所有参数应用弹性权重巩固（EWC），并研究了由Arc、Belebele、Gsm8K、Hellaswag、MMLU、TruthfulQA和Winogrande（均包括英语和立陶宛语版本）集合组成的语言理解基准测试以及困惑度基准测试。实验结果表明，EWC正则化不仅可以缓解灾难性遗忘效应，还有助于使用LLM学习新任务。