LLM2D
“既然律师都是男性……”:探究大型语言模型在印地语生成中的隐性性别偏见
'Since Lawyers are Males..': Examining Implicit Gender Bias in Hindi Language Generation by LLMs
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13484v1

摘要

arXiv:2409.13484v1 公告类型: 交叉 摘要: 大型语言模型 (LLMs) 正越来越多地被用于生成各种语言的文本,用于翻译、客户支持、教育等任务。尽管取得了这些进展,LLMs 在英语中表现出显著的性别偏见,当生成像印地语这样相对较少代表性的语言内容时,这种偏见变得更加明显。本研究探讨了印地语文本生成中的隐性性别偏见,并将其与英语中的偏见进行了比较。我们开发了受 WinoBias 启发的印地语数据集,以检查 GPT-4o 和 Claude-3 sonnet 等模型在响应中的刻板模式。我们的结果显示,印地语中的性别偏见高达 87.8%,而英语 GPT-4o 生成中的偏见为 33.4%,印地语响应经常依赖于与职业、权力等级和社会阶层相关的性别刻板印象。这项研究强调了不同语言间性别偏见的差异,并为在生成性人工智能系统中应对这些偏见提供了考虑因素。