摘要
微调可能是将预训练模型(例如基础模型)调整到下游应用的最直接方法,但它也存在丢失模型在预训练中学习到的宝贵知识的风险。例如,将能够识别大量类别的预训练分类器微调以掌握手头的类别子集,已被证明会大幅降低模型在之前学习到的其他类别中的准确性。因此,当微调后的模型遇到超出微调数据的类别时,很难进一步使用它。在本文中,我们系统地剖析了这个问题,旨在回答一个基本问题,“微调后的模型中究竟发生了什么损坏?”令我们惊讶的是,我们发现微调后的模型既没有忘记其他类别之间的关系,也没有降低识别这些类别的特征。相反,微调后的模型通常会为这些其他类别产生更多判别性特征,即使它们在微调期间缺失!{真正影响准确性的是微调类别和其他类别之间的对数几率尺度差异},这意味着简单的后处理校准将恢复预训练模型的能力,同时揭示所有类别的特征改进。我们进行了广泛的实证研究来证明我们发现的稳健性,并提供了对其背后的初步解释,为未来的理论分析指明了新的方向。我们的代码可在 https://github.com/OSU-MLB/Fine-Tuning-Is-Fine-If-Calibrated 获取。