摘要
机器学习预测的公平性由于法律、伦理和社会原因在实践中被广泛要求。现有工作通常关注没有未观察到的混杂因素的环境,即使未观察到的混杂因素可能导致严重违反因果公平性,从而导致不公平的预测。在这项工作中,我们分析了因果公平性对未观察到的混杂因素的敏感性。我们的贡献有三方面。首先,我们推导了不同来源的未观察到的混杂因素下因果公平性指标的界限。这使从业人员能够检查其机器学习模型在公平性关键应用中对未观察到的混杂因素的敏感性。其次,我们提出了一种新的神经网络框架来学习公平预测,这使我们能够提供因果公平性可能因未观察到的混杂因素而被违反的程度的最坏情况保证。第三,我们在一系列实验中证明了我们框架的有效性,包括一个关于预测监狱判决的真实案例研究。据我们所知,我们是第一个研究未观察到的混杂因素下因果公平性的工作。为此,我们的工作作为一种反驳策略,以确保高风险应用中预测的公平性,具有直接的实用价值。