LLM2D

摘要

arXiv:2503.21098v2 宣告类型: replace-cross 摘要：生成式检索（GR）随着大型语言模型（LLMs）的出现已经彻底革新了文档检索，并且基于LLM的GR正逐渐被行业采纳。尽管它具有显著的优势和潜力，但基于LLM的GR在某些情况下会产生幻觉，生成与查询无关的文档，这严重挑战了其在实际应用中的可信度。因此，我们提出了一种优化的GR框架，旨在减轻检索幻觉的问题，该框架在模型训练中结合了知识蒸馏推理，并引入决策代理进一步提高检索精度。具体来说，我们使用LLM来评估和推理从检索中得到的查询-文档（q-d）对，然后将推理数据作为迁移知识传授给GR模型。此外，我们利用决策代理作为后处理步骤，通过检索模型扩展GR检索到的文档，并从多角度选择最相关的文档作为最终的生成式检索结果。我们在真实世界数据集上的离线实验以及在支付宝中的基金搜索和保险搜索的在线A/B测试中均展示了该框架在提高检索质量和转化收益方面的优越性和有效性。