LLM2D
TrustRAG:一种检索增强生成的信息助手
TrustRAG: An Information Assistant with Retrieval Augmented Generation
作者: Yixing Fan, Qiang Yan, Wenshan Wang, Jiafeng Guo, Ruqing Zhang, Xueqi Cheng
发布日期: 2/20/2025
arXiv ID: oai:arXiv.org:2502.13719v1

摘要

arXiv:2502.13719v1 交叉公告类型: cross 摘要:RAG( Retrieval-Augmented Generation)已成为一种关键的技术,用于增强大型模型的实时和领域特定知识。尽管已经提出了众多改进和开源工具来提高RAG框架的准确性,但相对较少关注生成结果的可信度。为填补这一空白,我们提出了TrustRAG,这是一种新颖的框架,从索引、检索和生成三个角度增强RAG。具体而言,在索引阶段,我们提出了一种语义增强的分块策略,结合层次索引来补充每个分块的相关信息,确保语义完备。在检索阶段,我们引入了一种基于实用性的筛选机制来识别高质量的信息,支持答案生成并减少输入长度。在生成阶段,我们提出了细粒度的引用增强,该方法检测响应中的意见句并推断句子级的引用关系,从而提高引用准确性。我们开源了TrustRAG框架,并提供了一个专为节选问题回答任务设计的演示工作室(https://huggingface.co/spaces/golaxy/TrustRAG)。基于这些,我们旨在帮助研究人员:1)系统地增强RAG系统的可信度;2)开发具有更可靠输出的自己的RAG系统。