LLM2D

摘要

arXiv:2502.02013v1 类型: cross 摘要:从提取特征到生成文本，大型语言模型（LLMs）的输出通常依赖于其最终层，这一观点认为早期层只能捕捉低层级线索。然而，我们的分析表明，中间层可以编码更加丰富的表示，通常在多种下游任务中表现更好。为了解释和量化这些隐藏层的性质，我们提出了一种基于信息理论、几何和输入扰动不变性的统一表示质量度量框架。该框架突显了每一层模型在信息压缩和信号保留之间的平衡，揭示了为什么中间深度嵌入有时会超越最终层的表现。通过在32个文本嵌入任务中进行广泛的实验，并在模型架构（变换器、状态空间模型）和领域（语言、视觉）之间进行比较，我们证明了中间层始终提供更强的特征。这些发现挑战了对最终层嵌入的传统关注，并为模型分析和优化开辟了新的方向，包括战略性使用中间层表示以构建更稳健和准确的人工智能系统。