摘要
arXiv:2407.11442v3 宣告类型: 重置
摘要: 已经提出了大量的公平性度量标准,人工智能(AI)专家们将其用于定量衡量偏见并定义AI模型中的公平性。认识到需要适应不同相关方的多元公平性理解,人们正在努力寻求他们的反馈。然而,向缺乏AI专业知识的相关方传达AI公平性度量标准、捕捉他们的个人偏好以及寻求集体一致意见仍然具有挑战性和尚未充分探索。为了弥合这一差距,我们提出了一种新的框架,称为EARN Fairness,该框架可以在不需要AI专业知识的情况下帮助相关方集体决策公平性度量标准。该框架的特点是一个可适应的交互系统以及一个以相关方为中心的EARN Fairness过程,包括解释公平性度量标准、询问相关方的个人度量偏好、集体审查度量标准以及通过协商达成度量选择的共识。为了收集实证结果,我们将该框架应用于信用评级场景,并对18名没有AI知识的决策主体进行了用户研究。我们确定了他们的个人度量偏好以及他们可接受的不公平程度。随后,在团体会议中发现了他们如何达成度量共识的过程。我们的研究表明,EARN Fairness框架使相关方能够表达个人偏好并达成共识,为在高风险环境下实施以人为中心的AI公平性提供了实际指导。通过这种方法,我们旨在协调不同相关方的公平性期望,促进更加公平和平等的AI公平性。