LLM2D

摘要

arXiv:2504.14810v1 宣布类型: 新摘要: 为特定领域适应而对大型语言模型（LLMs）进行即兴指令微调是广泛采用的方法。虽然领域特定的监督微调（SFT）有效且高效，但往往会削弱跨领域的泛化能力，并且难以处理嘈杂的训练数据。为了解决这些挑战，我们提出了一种轻量级的模型内在数据剪枝方法DONOD。我们的方法使用两个基于模型参数的度量标准来评估数据：Δ范数（DON），它捕捉了对模型权重的影响积累，以及Δ范数范数（NOD），它量化了权重的不稳定性。此外，通过采用理想解法排序优选法（TOPSIS）算法，我们有效地过滤掉了嘈杂的、不可学习的和泛化能力受损的样本，而无需在SFT过程中依赖辅助模型。在数学任务上的实验表明，DONOD选择的数据在微调效率上表现出色，并且在嘈杂数据下的鲁棒性得到改善。通过过滤掉60%的完整数据集，我们提高了目标领域的准确率14.90%和跨领域的准确率5.67%。同时，我们选择的数据在跨架构泛化上表现出色。较小的模型（例如，Llama 3.1-8B）剪枝后能够有效地泛化到较大的模型（例如，Llama 2-13B）。与现有的相关方法相比，DONOD表现出相当或更优的性能，同时保持对数据集的无偏差性，从而使其具有更广泛的适用性。