LLM2D
DONOD:通过模型内在数据集修剪实现LLMs的稳健且通用的指令微调
DONOD: Robust and Generalizable Instruction Fine-Tuning for LLMs via Model-Intrinsic Dataset Pruning
作者: Jucheng Hu, Surong Yang, Dongzhan Zhou, Lijun Wu
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.14810v1

摘要

arXiv:2504.14810v1 宣布类型: 新 摘要: 为特定领域适应而对大型语言模型(LLMs)进行即兴指令微调是广泛采用的方法。虽然领域特定的监督微调(SFT)有效且高效,但往往会削弱跨领域的泛化能力,并且难以处理嘈杂的训练数据。为了解决这些挑战,我们提出了一种轻量级的模型内在数据剪枝方法DONOD。我们的方法使用两个基于模型参数的度量标准来评估数据:Δ范数(DON),它捕捉了对模型权重的影响积累,以及Δ范数范数(NOD),它量化了权重的不稳定性。此外,通过采用理想解法排序优选法(TOPSIS)算法,我们有效地过滤掉了嘈杂的、不可学习的和泛化能力受损的样本,而无需在SFT过程中依赖辅助模型。在数学任务上的实验表明,DONOD选择的数据在微调效率上表现出色,并且在嘈杂数据下的鲁棒性得到改善。通过过滤掉60%的完整数据集,我们提高了目标领域的准确率14.90%和跨领域的准确率5.67%。同时,我们选择的数据在跨架构泛化上表现出色。较小的模型(例如,Llama 3.1-8B)剪枝后能够有效地泛化到较大的模型(例如,Llama 2-13B)。与现有的相关方法相比,DONOD表现出相当或更优的性能,同时保持对数据集的无偏差性,从而使其具有更广泛的适用性。