摘要
检索增强生成 (RAG) 作为一种弥补大型语言模型 (LLM) 参数化知识的方法,在开放域问答 (ODQA) 任务中受到了广泛关注。虽然之前的方法侧重于处理检索到的段落以去除无关上下文,但它们仍然严重依赖于检索到的段落的质量,如果问题模棱两可或复杂,则会降低检索质量。在本文中,我们提出了一种简单而高效的方法,称为通过 LLM 进行问题和段落增强 (QPaug),用于开放域问答。QPaug 首先将原始问题分解为多步子问题。通过用详细的子问题和计划增强原始问题,我们能够使查询更具体地说明需要检索的内容,从而提高检索性能。此外,为了弥补检索到的段落包含干扰信息或不同观点的情况,我们通过 LLM 增强检索到的段落,用自生成段落来指导答案提取。实验结果表明,QPaug 优于之前的最先进方法,并且在现有的 RAG 方法上取得了显著的性能提升。源代码可在 \url{https://github.com/kmswin1/QPaug} 获取。