摘要
arXiv:2504.14123v1 宣告类型: 新
摘要: 提示学习是一种由于其高效性而流行的视觉-语言模型微调方法。它只需要少量额外的学习参数,同时在目标任务上显著提高性能。然而,现有的大多数方法会过度拟合微调数据,导致泛化能力差。为了解决这一问题,我们提出了一种基于贝叶斯学习原理的新训练目标函数,以平衡适应性和泛化能力。我们在归一化输出(logits)上定义了一个先验分布,其中均值函数由预训练模型参数化,而后验分布对应于微调模型。该目标通过允许微调模型适应下游任务,同时保持与预训练模型的接近性,实现了这种平衡。