LLM2D

摘要

arXiv:2502.04645v1 声明类型: cross 摘要：神经排序模型（NRMs）在信息检索任务中迅速提升了最新的性能。在本项工作中，我们调查了一种MiniLM的Cross-Encoder变体，以确定它计算哪些相关性特征以及这些特征存储在哪里。我们发现，它以一种可解释的方式使用了传统的BM25的语义变体，其中包括局部组件：（1）通过控制词汇项饱和度和文档长度效应来计算软词频的Transformer注意力头，（2）其嵌入矩阵的低秩组件，编码词汇表中的逆文档频率信息。这表明Cross-Encoder使用与BM25相同的基本机制，但进一步利用它们的能力来捕捉语义以提高检索性能。这种精细的理解为模型编辑提供了基础，以增强模型透明度、解决安全问题，并提高训练和实际应用中的扩展性。