LLM2D

摘要

arXiv:2504.12323v1 交叉领域类型：cross 摘要：检索增强生成（RAG）通过从外部知识源检索相关文档来增强大型语言模型（LLMs）。通过引用这些外部知识，RAG 有效地减少了生成事实错误内容的可能性，并解决了LLMs 中的幻想问题。最近，从各种角度提高 RAG 系统的性能和效率引起了越来越多的关注。尽管这些进展取得了显著成果，但 RAG 在具有重大社会意义的领域中的应用引发了一个关键问题——即引入 RAG 帕兹义对 LLM 的公平性有何影响？为了回答这一问题，我们通过改变 LLMs、检索器和检索来源进行了广泛的实验分析。我们的实验分析表明，LLM 的规模在 RAG 框架中对公平性结果产生显著影响。当模型规模小于 8B 时，集成检索机制往往会加剧小型 LLM（如 LLaMA3.2-1B、Mistral-7B 和 LLaMA3-8B）中的不公平性。为了缓解由于 RAG 引入的小型 LLM 中的公平性问题，我们提出了两种方法：FairFT 和 FairFilter。在 FairFT 中，我们使检索器在公平性方面与 LLM 对齐，使它能够检索出促进更公平模型输出的文档。在 FairFilter 中，我们提出了一种公平性过滤机制，在检索后过滤掉有偏见的内容。最后，我们在实际数据集上验证了我们提出的方法，证明了它们在提高公平性的同时保持性能有效性的能力。