摘要
arXiv:2504.14493v2 消息类型: 替换-交叉
摘要: 在现实世界的应用场景中利用大型语言模型通常需要使用特定领域的数据和工具,以遵守合理的使用所需的复杂规定。在金融领域,现代企业越来越多地依赖检索增强生成(RAG)系统来解决金融文件工作流程中的复杂合规要求。然而,现有的解决方案难以应对数据的固有异质性(例如,文本、表格、图表)和监管标准的不断变化,导致关键信息提取的准确性受到损害。我们提出了FinSage框架作为解决方案,利用一个针对多模态金融文件合规性分析的多方面RAG框架。FinSage引入了三个创新组件:(1)一个多模态预处理流水线,统一各种数据格式并生成片段级别的元数据摘要;(2)一个多路径稀疏-密集检索系统,增强有查询扩展(HyDE)和元数据意识的语义搜索;(3)一个通过直接偏好优化(DPO)微调的领域专门化的重新排名模块,以优先处理合规性关键内容。大量的实验表明,FinSage在75个由FinanceBench问题回答数据集中超过基线方法24.06%的准确率上实现了92.51%的召回率。此外,FinSage已经在在线会议上成功部署为金融问答代理,已经为其超过1,200人提供了服务。