摘要
arXiv:2409.13484v1 公告类型: 交叉 摘要: 大型语言模型 (LLMs) 正越来越多地被用于生成各种语言的文本,用于翻译、客户支持、教育等任务。尽管取得了这些进展,LLMs 在英语中表现出显著的性别偏见,当生成像印地语这样相对较少代表性的语言内容时,这种偏见变得更加明显。本研究探讨了印地语文本生成中的隐性性别偏见,并将其与英语中的偏见进行了比较。我们开发了受 WinoBias 启发的印地语数据集,以检查 GPT-4o 和 Claude-3 sonnet 等模型在响应中的刻板模式。我们的结果显示,印地语中的性别偏见高达 87.8%,而英语 GPT-4o 生成中的偏见为 33.4%,印地语响应经常依赖于与职业、权力等级和社会阶层相关的性别刻板印象。这项研究强调了不同语言间性别偏见的差异,并为在生成性人工智能系统中应对这些偏见提供了考虑因素。