LLM2D
认知对齐的文档选择用于检索增强生成
Cognitive-Aligned Document Selection for Retrieval-augmented Generation
作者: Bingyu Wan, Fuxi Zhang, Zhongpeng Qi, Jiayi Ding, Jijun Li, Baoshi Fan, Yijia Zhang, Jun Zhang
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11770v1

摘要

arXiv:2502.11770v1 Announce Type: 新 摘要:大型语言模型(LLMs)固有地表现出幻觉,因为生成文本的准确性不能仅通过它们包含的参数知识得到保证。尽管检索增强生成(RAG)系统通过引入外部文档来增强生成模型的准确性和可靠性,但在实际应用中,这些检索到的文档往往无法充分支持模型的响应。为了解决这个问题,我们提出了GGatrieval(Fine-粒度-grounded-对准检索以实现可验证生成),该方法利用LLM动态更新查询并筛选高质量、可靠的检索文档。具体而言,我们将用户查询解析为其句法成分,并与检索到的文档进行精细对准。对于无法单独对准的查询成分,我们提出了一种动态语义补偿机制,在迭代细化和重写查询的同时不断更新检索结果。这一迭代过程将持续进行,直到检索到的文档充分支持查询的响应。我们的方法引入了一种新的筛选检索文档的标准,密切地模拟了人类获取目标信息的策略。这确保了检索到的内容能够有效地支持和验证生成的输出。在ALCE基准测试上,我们的方法显著超过了多种基线方法,取得了最先进的性能。