LLM2D

摘要

确保模型答案的可验证性是问答 (QA) 领域中检索增强生成 (RAG) 的一项基本挑战。最近，提出了自引用提示，以使大型语言模型 (LLM) 除了答案之外，还能生成对支持文档的引用。然而，自引用的 LLM 通常难以匹配所需的格式，引用不存在的来源，并且无法忠实地反映 LLM 在整个生成过程中对上下文的用法。在这项工作中，我们提出了 MIRAGE -- 基于模型内部的 RAG 解释 -- 一种即插即用方法，使用模型内部来实现 RAG 应用程序中忠实的答案归因。MIRAGE 检测上下文相关的答案标记，并将它们与通过显著性方法预测其预测的检索文档配对。我们在多语言抽取式 QA 数据集上评估了我们提出的方法，发现与人类答案归因高度一致。在开放式 QA 中，MIRAGE 实现了与自引用相当的引用质量和效率，同时还允许更精细地控制归因参数。我们的定性评估突出了 MIRAGE 归因的忠实性，并强调了模型内部在 RAG 答案归因中的有前景的应用。