LLM2D

摘要

arXiv:2504.12063v1 类别: cross 摘要：现代检索系统并不依赖单一的排名模型来构建其排名。相反，它们通常采取一种级联的方法，在多个重新排名阶段应用一系列的排名模型。通过这种方式，它们在保持顶级文档排名质量的同时，限制每个模型需要重新排名的文档数量，从而平衡排名质量和计算成本。然而，级联方法并不是模型之间唯一可能的交互方式，形成检索系统的方法。我们提出了复合检索系统的概念，作为一类更广泛的检索系统，这些系统应用了多个预测模型。这种概念包含了级联模型，但还允许其他类型的交互，而不仅仅是排名最靠前的文档的重新排名。特别是，我们允许与大规模语言模型（LLMs）的交互，这些模型可以提供相关性的相对比较。我们专注于优化复合检索系统的设计，这种设计的独特之处在于学习如何应用各个组件模型以及如何将它们的预测综合成最终的排名。我们的研究展示了我们的复合方法如何可以将经典的BM25检索模型与最先进的（成对的）LLM相关性预测相结合，同时优化给定的排名度量和效率目标。实验结果表明，优化的复合检索系统在有效性和效率之间提供了更好的权衡，即使在自我监督的情况下也是如此。通过引入复合检索系统，我们希望激励信息检索领域更多地从预测模型如何交互以形成排名的角度进行创新思考。