LLM2D
基于最优传输的分布式反事实解释
Distributional Counterfactual Explanations With Optimal Transport
作者: Lei You, Lele Cao, Mattias Nilsson, Bo Zhao, Lei Lei
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2401.13112v4

摘要

反事实解释(CE)是通过识别导致不同结果的替代输入,来洞悉黑盒决策模型的实际方法。然而,现有的 CE 方法,包括群体方法和全局方法,主要关注特定输入的修改,缺乏捕捉影响整个输入-输出频谱中模型结果的细微分布特征的能力。本文提出了一种分布式反事实解释(DCE),将重点转移到观察数据和反事实数据的分布特性,从而提供更广泛的见解。DCE 对基于统计数据分析做出战略决策的利益相关者特别有利,因为它使反事实的统计分布在将模型输出与目标分布对齐时,类似于事实的统计分布——这是现有 CE 方法无法完全实现的。我们利用最优传输(OT)来制定一个机会约束优化问题,推导出一个与其实际对应物相一致的反事实分布,并得到统计置信度的支持。实验结果证明了该方法的有效性,突出了其在提供对决策模型的更深入见解方面的潜力。