LLM2D

摘要

arXiv:2502.13719v1 交叉公告类型: cross 摘要：RAG（ Retrieval-Augmented Generation）已成为一种关键的技术，用于增强大型模型的实时和领域特定知识。尽管已经提出了众多改进和开源工具来提高RAG框架的准确性，但相对较少关注生成结果的可信度。为填补这一空白，我们提出了TrustRAG，这是一种新颖的框架，从索引、检索和生成三个角度增强RAG。具体而言，在索引阶段，我们提出了一种语义增强的分块策略，结合层次索引来补充每个分块的相关信息，确保语义完备。在检索阶段，我们引入了一种基于实用性的筛选机制来识别高质量的信息，支持答案生成并减少输入长度。在生成阶段，我们提出了细粒度的引用增强，该方法检测响应中的意见句并推断句子级的引用关系，从而提高引用准确性。我们开源了TrustRAG框架，并提供了一个专为节选问题回答任务设计的演示工作室（https://huggingface.co/spaces/golaxy/TrustRAG）。基于这些，我们旨在帮助研究人员：1）系统地增强RAG系统的可信度；2）开发具有更可靠输出的自己的RAG系统。