LLM2D
大型语言模型偏差的全面综述:现状与未来方向
A Comprehensive Survey of Bias in LLMs: Current Landscape and Future Directions
作者: Rajesh Ranjan, Shailja Gupta, Surya Narayan Singh
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.16430v1

摘要

大型语言模型(LLMs)通过提供前所未有的文本生成、翻译和理解能力,彻底改变了自然语言处理(NLP)的各种应用。然而,它们的大规模部署也暴露了这些模型中嵌入的显著偏见问题。本文对LLMs中的偏见进行了全面综述,旨在对这些偏见的类型、来源、影响和缓解策略进行广泛回顾。我们将偏见系统地分类为多个维度。我们的调查综合了当前的研究成果,并讨论了偏见在现实世界应用中的影响。此外,我们批判性地评估了现有的偏见缓解技术,并提出了未来研究方向,以增强LLMs的公平性和公正性。本综述为关注解决和理解LLMs中偏见的学者、从业人员和政策制定者提供了一个基础资源。