LLM2D

摘要

arXiv:2505.07345v1 交叉类型: cross 摘要: 大型语言模型（LLMs）在信息检索中广泛用于相关性评估。然而，我们的研究显示，结合两种具有不同架构的不同小型语言模型（SLMs）可以在这一任务上超过LLMs的表现。我们的方法——QUPID——将生成型SLM与基于嵌入的SLM结合起来，在保持比最先进的LLM解决方案更高的相关性判断准确性的同时，还减少了计算成本。这种计算效率使得QUPID在处理每日数百万查询的实际搜索系统中具有高度可扩展性。在跨不同文档类型的实验中，我们的方法在一致性性能提升方面表现优异（Cohen's Kappa值为0.646，而最先进的LLM为0.387），同时推理时间快60倍。此外，当集成到生产搜索管道中时，QUPID将nDCG@5分数提高了1.9%。这些发现表明，模型组合中的架构多样性可以在信息检索系统中大幅提升搜索相关性和操作效率。