LLM2D

摘要

arXiv:2504.14123v1 宣告类型: 新摘要: 提示学习是一种由于其高效性而流行的视觉-语言模型微调方法。它只需要少量额外的学习参数，同时在目标任务上显著提高性能。然而，现有的大多数方法会过度拟合微调数据，导致泛化能力差。为了解决这一问题，我们提出了一种基于贝叶斯学习原理的新训练目标函数，以平衡适应性和泛化能力。我们在归一化输出（logits）上定义了一个先验分布，其中均值函数由预训练模型参数化，而后验分布对应于微调模型。该目标通过允许微调模型适应下游任务，同时保持与预训练模型的接近性，实现了这种平衡。