LLM2D

摘要

arXiv:2503.21098v3 公告类型: 交叉替换摘要：生成式检索（GR）在大规模语言模型（LLMs）的出现下革新了文档检索，基于LLM的GR正逐渐被行业采用。尽管它具有显著的优点和潜力，但基于LLM的GR却遭受幻觉问题，并在一些情况下生成与查询无关的文档，这严重挑战了其在实际应用中的可信度。因此，我们提出了一种优化的GR框架，旨在减轻检索幻觉问题，该框架在模型训练中整合了知识蒸馏推理，并结合决策代理以进一步提高检索精度。具体而言，我们利用LLM评估和推理检索到的查询-文档（q-d）对，并将推理数据作为 transfer 知识传递给GR模型。此外，我们使用决策代理作为后处理步骤，通过检索模型扩展GR检索到的文档，并从多个角度选择最相关的文档作为最终生成检索结果。在实际数据集上的大量离线实验和支付宝基金搜索和保险搜索的在线A/B测试表明，我们的框架在提高搜索质量和转化率方面表现优异且有效。