摘要
社会科学研究表明,具有特定种族或性别暗示的名字的候选人往往在就业实践中面临歧视。类似地,大型语言模型 (LLM) 在各种应用中表现出种族和性别偏见。在本研究中,我们利用 GPT-3.5-Turbo 和 Llama 3-70B-Instruct 来模拟对 320 个强烈表明其种族和性别的名字的候选人的招聘决定和薪资建议,涵盖超过 750,000 个提示。我们的实证结果表明,这些模型倾向于在 40 个职业中雇用具有白人女性名字的候选人,而不是其他人口群体。此外,即使在资格相同的候选人中,薪资建议在不同亚组之间也可能相差 5%。与现实世界劳动力数据的比较揭示了与美国劳动力市场特征的不一致性,突出了对 LLM 驱动的系统进行风险调查的必要性。