LLM2D

摘要

arXiv:2505.08463v1 类型: cross 摘要：微调预训练语言模型（PLMs）已成为将PLMs应用于下游任务的主要范式。然而，即使进行了有限的微调，PLMs仍然难以解决由PLMs编码器获得的表示与PLMs解码器的最佳输入之间的差异。本文通过在隐空间中学习校准PLMs的表示来应对这一挑战。在提出的方法RepCali中，我们在编码器之后的隐空间中整合了一个特定的校准块，并将校准后的输出作为解码器的输入。RepCali的优点包括其适用于所有具有编码器-解码器架构的PLMs的通用性、插件性质和易实现性。在8个任务（包括英文和中文数据集）上的25个基于PLM的模型的广泛实验表明，提出的方法RepCali为PLMs（包括LLMs）提供了可喜的增强，并显著改善了下游任务的性能。在4个基准任务的比较实验中，RepCali优于代表性的微调基线。