LLM2D

摘要

arXiv:2505.06889v1 通知类型: cross 摘要：预训练语言模型（PLMs）通过预训练和微调在多种自然语言处理（NLP）任务中取得了卓越的性能。然而，通过对参数数量众多但下游数据集有限的模型进行微调，往往会导致模型对对抗攻击的脆弱性增加，从而在标准数据集上过拟合。为了应对这些问题，我们从动态系统视角出发，将BERT的一层概念化为常微分方程（ODEs）的解，并在初始值扰动的情况下分析了两种主要的数值ODE求解器：显式欧拉法和隐式欧拉法的数值稳定性。基于这些分析，我们引入了一种数值稳健的IM-连接，结合了BERT的层。该策略增强了PLMs在对抗攻击下的鲁棒性，即使在资源有限的情景下也是如此，而无需引入额外的参数或对抗训练策略。通过对抗GLUE（AdvGLUE）数据集上的实验结果验证了IM-BERT在各种条件下的鲁棒性。与原始BERT相比，在AdvGLUE数据集上，IM-BERT的性能提升了约8.3%。此外，在资源有限的情景中，IM-BERT表现优于BERT，准确率提升了5.9%。