LLM2D
面向多种语言和文化的第一步方法以应对大型语言模型应用中的误性别描述问题
A Multilingual, Culture-First Approach to Addressing Misgendering in LLM Applications
作者: Sunayana Sitaram, Adrian de Wynter, Isobel McCrum, Qilong Gu, Si-Qing Chen
发布日期: 3/27/2025
arXiv ID: oai:arXiv.org:2503.20302v1

摘要

arXiv:2503.20302v1 宣告类型: cross 摘要: 误称是指使用与某人所选身份不符的性别来进行指称的行为。这会削弱一个人对其自我认知的感受,造成严重伤害。基于英语的方法在这方面有明确避免误称的方法,例如使用代词“they”。“他们”等代词能够明确地指代某个具体的人,避免了性别冲突。然而,其他语言由于语法和文化结构的不同,呈现出独特的挑战。在本工作中,我们开发了一种方法来评估并缓解42种语言和方言中的误称问题,并采用了参与式设计方法来设计适用于所有语言的有效和合适的防护措施。我们在一个标准的大规模语言模型基础应用(会议纪要摘要化)中测试了这些防护措施,其中数据生成和标注步骤均采用了人工参与的方式。我们发现,提出的防护措施在所有语言生成的摘要中显著减少了误称率,且未牺牲质量。我们的人工参与方法展示了在多种语言和文化中可行地规模化实施包容性和负责任的人工智能解决方案的方法。