LLM2D
硬币的另一面:探索检索增强生成中的公平性
The Other Side of the Coin: Exploring Fairness in Retrieval-Augmented Generation
作者: Zheng Zhang, Ning Li, Qi Liu, Rui Li, Weibo Gao, Qingyang Mao, Zhenya Huang, Baosheng Yu, Dacheng Tao
发布日期: 4/18/2025
arXiv ID: oai:arXiv.org:2504.12323v1

摘要

arXiv:2504.12323v1 交叉领域类型:cross 摘要:检索增强生成(RAG)通过从外部知识源检索相关文档来增强大型语言模型(LLMs)。通过引用这些外部知识,RAG 有效地减少了生成事实错误内容的可能性,并解决了LLMs 中的幻想问题。最近,从各种角度提高 RAG 系统的性能和效率引起了越来越多的关注。尽管这些进展取得了显著成果,但 RAG 在具有重大社会意义的领域中的应用引发了一个关键问题——即引入 RAG 帕兹义对 LLM 的公平性有何影响?为了回答这一问题,我们通过改变 LLMs、检索器和检索来源进行了广泛的实验分析。我们的实验分析表明,LLM 的规模在 RAG 框架中对公平性结果产生显著影响。当模型规模小于 8B 时,集成检索机制往往会加剧小型 LLM(如 LLaMA3.2-1B、Mistral-7B 和 LLaMA3-8B)中的不公平性。为了缓解由于 RAG 引入的小型 LLM 中的公平性问题,我们提出了两种方法:FairFT 和 FairFilter。在 FairFT 中,我们使检索器在公平性方面与 LLM 对齐,使它能够检索出促进更公平模型输出的文档。在 FairFilter 中,我们提出了一种公平性过滤机制,在检索后过滤掉有偏见的内容。最后,我们在实际数据集上验证了我们提出的方法,证明了它们在提高公平性的同时保持性能有效性的能力。