LLM2D

摘要

微调可能是将预训练模型（例如基础模型）调整到下游应用的最直接方法，但它也存在丢失模型在预训练中学习到的宝贵知识的风险。例如，将能够识别大量类别的预训练分类器微调以掌握手头的类别子集，已被证明会大幅降低模型在之前学习到的其他类别中的准确性。因此，当微调后的模型遇到超出微调数据的类别时，很难进一步使用它。在本文中，我们系统地剖析了这个问题，旨在回答一个基本问题，“微调后的模型中究竟发生了什么损坏？”令我们惊讶的是，我们发现微调后的模型既没有忘记其他类别之间的关系，也没有降低识别这些类别的特征。相反，微调后的模型通常会为这些其他类别产生更多判别性特征，即使它们在微调期间缺失！{真正影响准确性的是微调类别和其他类别之间的对数几率尺度差异}，这意味着简单的后处理校准将恢复预训练模型的能力，同时揭示所有类别的特征改进。我们进行了广泛的实证研究来证明我们发现的稳健性，并提供了对其背后的初步解释，为未来的理论分析指明了新的方向。我们的代码可在 https://github.com/OSU-MLB/Fine-Tuning-Is-Fine-If-Calibrated 获取。