LLM2D

摘要

微调可以说是将预训练模型（例如基础模型）调整到下游应用的最直接方法，但它也存在着丢失模型在预训练过程中学习到的宝贵知识的风险。例如，将能够识别大量类别的预训练分类器微调以掌握手头的类别子集，会导致模型在之前学习过的其他类别上的准确率急剧下降。因此，当微调后的模型遇到超出微调数据的类别时，很难进一步使用它。在本文中，我们系统地剖析了这个问题，旨在回答一个基本问题：“微调后的模型中哪些部分受到了损坏？”令我们惊讶的是，我们发现微调后的模型既没有忘记其他类别之间的关系，也没有降低识别这些类别的特征。相反，微调后的模型通常会为这些其他类别生成更具辨别性的特征，即使这些特征在微调过程中缺失！{真正影响准确率的是微调类别和其他类别之间的对数几率尺度差异}，这意味着简单的后处理校准将恢复预训练模型的能力，同时揭示所有类别的特征改进。我们进行了广泛的实证研究，以证明我们发现的稳健性，并提供了对这些发现的初步解释，为未来的理论分析指明了新的方向。我们的代码可在 https://github.com/OSU-MLB/Fine-Tuning-Is-Fine-If-Calibrated 获取。