LLM2D
基于模型内部机制的可信检索增强生成答案归因
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
作者: Jirui Qi, Gabriele Sarti, Raquel Fern\'andez, Arianna Bisazza
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2406.13663v3

摘要

确保模型答案的可验证性是问答 (QA) 领域中检索增强生成 (RAG) 的一项基本挑战。最近,提出了自引用提示,以使大型语言模型 (LLM) 除了答案之外,还能生成对支持文档的引用。然而,自引用的 LLM 通常难以匹配所需的格式,引用不存在的来源,并且无法忠实地反映 LLM 在整个生成过程中对上下文的用法。在这项工作中,我们提出了 MIRAGE -- 基于模型内部的 RAG 解释 -- 一种即插即用方法,使用模型内部来实现 RAG 应用程序中忠实的答案归因。MIRAGE 检测上下文相关的答案标记,并将它们与通过显著性方法预测其预测的检索文档配对。我们在多语言抽取式 QA 数据集上评估了我们提出的方法,发现与人类答案归因高度一致。在开放式 QA 中,MIRAGE 实现了与自引用相当的引用质量和效率,同时还允许更精细地控制归因参数。我们的定性评估突出了 MIRAGE 归因的忠实性,并强调了模型内部在 RAG 答案归因中的有前景的应用。