LLM2D
公平与性能兼顾:数据去偏见是全部所需
Fairness And Performance In Harmony: Data Debiasing Is All You Need
作者: Junhua Liu, Wendy Wan Yee Hui, Roy Ka-Wei Lee, Kwan Hui Lim
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2411.17374v1

摘要

机器学习(ML)预测和人工决策中的公平性至关重要,ML模型容易受到算法和数据偏差的影响,而人工决策则受主观性和认知偏差的影响。本研究使用包含 870 个个人资料的真实世界大学录取数据集,利用 XGB、Bi-LSTM 和 KNN 三种 ML 模型,调查了公平性问题。文本特征使用 BERT 嵌入进行编码。对于个体公平性,我们使用一致性评分评估了具有不同背景的专家和 ML 模型之间的决策一致性。结果表明,在公平性方面,ML 模型比人工决策高出 14.08% 到 18.79%。对于群体公平性,我们提出了一种性别去偏见流程,并证明了其在去除性别特异性语言而不影响预测性能方面的有效性。去偏见后,所有模型都保持或提高了其分类精度,验证了公平性和性能可以共存的假设。我们的研究结果突出了 ML 在提高录取公平性同时保持高精度的潜力,倡导将人工判断和 ML 模型相结合的混合方法。