LLM2D

摘要

检索增强生成 (RAG) 作为一种弥补大型语言模型 (LLM) 参数化知识的方法，在开放域问答 (ODQA) 任务中受到了广泛关注。虽然之前的方法侧重于处理检索到的段落以去除无关上下文，但它们仍然严重依赖于检索到的段落的质量，如果问题模棱两可或复杂，则会降低检索质量。在本文中，我们提出了一种简单而高效的方法，称为通过 LLM 进行问题和段落增强 (QPaug)，用于开放域问答。QPaug 首先将原始问题分解为多步子问题。通过用详细的子问题和计划增强原始问题，我们能够使查询更具体地说明需要检索的内容，从而提高检索性能。此外，为了弥补检索到的段落包含干扰信息或不同观点的情况，我们通过 LLM 增强检索到的段落，用自生成段落来指导答案提取。实验结果表明，QPaug 优于之前的最先进方法，并且在现有的 RAG 方法上取得了显著的性能提升。源代码可在 \url{https://github.com/kmswin1/QPaug} 获取。