LLM2D
奥卡姆模型:选择更简单的表示以获得更好的迁移性估计
Occam's model: Selecting simpler representations for better transferability estimation
作者: Prabhant Singh, Sibylle Hess, Joaquin Vanschoren
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.06925v1

摘要

arXiv:2502.06925v1 宣告类型: cross 摘要:使用大规模数据集进行预训练的模型微调已成为现代机器学习工作流程的基石。随着在线模型仓库(如Hugging Face)的广泛应用,现在比以往任何时候都更容易为特定任务微调预训练模型。这引发了一个关键问题:哪个预训练模型最适合给定任务?这个问题被称为转移性估计。在这项工作中,我们引入了两种新颖且有效的衡量预训练模型转移性的指标。我们的方法将转移性视为衡量预训练模型表示能够容易地被训练以区分目标类别的程度的一种度量,从而为转移性估计提供了一个独特的视角。我们严格地将提出的方法与最先进的替代方法在多种问题设置下进行评估,展示了其稳健性和实用价值。此外,我们还提出了理论洞察,解释了这些指标的效用及其在各种场景下的适应性。实验证明,与最先进的基线方法相比,我们的指标可以使Kendall's Tau增加高达32%。