LLM2D

摘要

arXiv:2505.07850v1 Announce Type: cross 摘要：随着大型语言模型在生成合成角色方面越来越广泛地应用于诸如健康、隐私和HCI等数据受限领域，理解这些叙事如何代表身份，尤其是少数群体的身份变得尤为重要。在本文中，我们通过代表伤害的视角对3个大型语言模型（GPT4o、Gemini 1.5 Pro、Deepseek 2.5）生成的合成角色进行了审查，重点关注种族身份。我们使用结合了细读、词汇分析和参数化创造力框架的混合方法，将1512个由大型语言模型生成的合成角色与人类撰写的角色进行了比较。我们的研究发现，大型语言模型在种族标记方面过度强调，过度生产文化编码语言，并构建了语法复杂但叙事简化的角色。这些模式导致了包括刻板印象、异国情调、抹去和善意偏见在内的社会技术危害，这些危害往往通过表面上积极的叙述被掩盖。我们正式将这种现象定义为算法歧视，其中被边缘化身份变得更加显而易见，但也显得不够真实。基于这些发现，我们提出了叙事意识评估指标和以社区为中心的验证协议的设计建议，用于合成身份的生成。