LLM2D
W-RAG:弱监督密集检索在开放领域问答中的应用
W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering
作者: Jinming Nian, Zhiyuan Peng, Qifan Wang, Yi Fang
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2408.08444v2

摘要

arXiv:2408.08444v2 通知类型: 替换-交叉 摘要:在开放领域问答(OpenQA)等知识密集型任务中,大型语言模型(LLMs)常常难以生成事实性的答案,仅依靠其内部(参数化)的知识。为解决这一局限性,检索增强生成(RAG)系统通过从外部来源检索相关信息来增强LLMs,从而将检索器定位为至关重要的组件。尽管密集检索显示出最先进的性能,但由于缺乏准确证据,其训练存在挑战,很大程度上归因于人类注释的高成本。在本文中,我们提出了一种W-RAG方法,该方法从LLM的下游任务(如OpenQA)中吸取弱训练信号,并对检索器进行微调,以优先处理对任务最有益的段落。具体来说,我们通过评估LLM在给定每个段落的情况下生成正确答案的概率,重新对通过BM25检索到的前-k个段落进行排序。然后,最高评分的段落作为密集检索的正向微调示例。我们在四个公开可用的OpenQA数据集上进行了全面实验,以证明我们的方法在检索和OpenQA性能上都优于基线模型,并且达到了与使用人工标注数据进行微调的模型相当的结果。