LLM2D

摘要

arXiv:2502.11770v1 Announce Type: 新摘要：大型语言模型（LLMs）固有地表现出幻觉，因为生成文本的准确性不能仅通过它们包含的参数知识得到保证。尽管检索增强生成（RAG）系统通过引入外部文档来增强生成模型的准确性和可靠性，但在实际应用中，这些检索到的文档往往无法充分支持模型的响应。为了解决这个问题，我们提出了GGatrieval（Fine-粒度-grounded-对准检索以实现可验证生成），该方法利用LLM动态更新查询并筛选高质量、可靠的检索文档。具体而言，我们将用户查询解析为其句法成分，并与检索到的文档进行精细对准。对于无法单独对准的查询成分，我们提出了一种动态语义补偿机制，在迭代细化和重写查询的同时不断更新检索结果。这一迭代过程将持续进行，直到检索到的文档充分支持查询的响应。我们的方法引入了一种新的筛选检索文档的标准，密切地模拟了人类获取目标信息的策略。这确保了检索到的内容能够有效地支持和验证生成的输出。在ALCE基准测试上，我们的方法显著超过了多种基线方法，取得了最先进的性能。