LLM2D

摘要

机器学习（ML）预测和人工决策中的公平性至关重要，ML模型容易受到算法和数据偏差的影响，而人工决策则受主观性和认知偏差的影响。本研究使用包含 870 个个人资料的真实世界大学录取数据集，利用 XGB、Bi-LSTM 和 KNN 三种 ML 模型，调查了公平性问题。文本特征使用 BERT 嵌入进行编码。对于个体公平性，我们使用一致性评分评估了具有不同背景的专家和 ML 模型之间的决策一致性。结果表明，在公平性方面，ML 模型比人工决策高出 14.08% 到 18.79%。对于群体公平性，我们提出了一种性别去偏见流程，并证明了其在去除性别特异性语言而不影响预测性能方面的有效性。去偏见后，所有模型都保持或提高了其分类精度，验证了公平性和性能可以共存的假设。我们的研究结果突出了 ML 在提高录取公平性同时保持高精度的潜力，倡导将人工判断和 ML 模型相结合的混合方法。