摘要
我们通过一个关于英语性别语言改革的案例研究(涉及诸如congressperson/-woman/-man和singular they等角色名词),研究了LLMs生成的文本中的语言意识形态。首先,我们发现政治偏见:当被要求使用“正确”或“自然”的语言时,LLMs使用的语言与被要求与保守(而非进步)价值观保持一致时最为相似。这表明,即使在看似非政治性的情境中,LLMs的元语言偏好也能隐含地传达特定政治群体的语言意识形态。其次,我们发现LLMs表现出内部不一致性:当提供更明确的元语言上下文时,LLMs更频繁地使用性别中性变体。这表明,LLMs生成的文本中表达的语言意识形态可能会有所变化,这可能是用户未曾预料到的。我们讨论了这些发现对价值对齐的更广泛影响。