LLM2D

摘要

arXiv:2408.08444v2 通知类型: 替换-交叉摘要：在开放领域问答（OpenQA）等知识密集型任务中，大型语言模型（LLMs）常常难以生成事实性的答案，仅依靠其内部（参数化）的知识。为解决这一局限性，检索增强生成（RAG）系统通过从外部来源检索相关信息来增强LLMs，从而将检索器定位为至关重要的组件。尽管密集检索显示出最先进的性能，但由于缺乏准确证据，其训练存在挑战，很大程度上归因于人类注释的高成本。在本文中，我们提出了一种W-RAG方法，该方法从LLM的下游任务（如OpenQA）中吸取弱训练信号，并对检索器进行微调，以优先处理对任务最有益的段落。具体来说，我们通过评估LLM在给定每个段落的情况下生成正确答案的概率，重新对通过BM25检索到的前-k个段落进行排序。然后，最高评分的段落作为密集检索的正向微调示例。我们在四个公开可用的OpenQA数据集上进行了全面实验，以证明我们的方法在检索和OpenQA性能上都优于基线模型，并且达到了与使用人工标注数据进行微调的模型相当的结果。