LLM2D
DiCE-Extended:一种在机器学习中对抗不可靠因素的反事实解释稳健方法
DiCE-Extended: A Robust Approach to Counterfactual Explanations in Machine Learning
作者: Volkan Bakir, Polat Goktas, Sureyya Akyuz
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2504.19027v1

摘要

arXiv:2504.19027v1 宣布类型: 新 摘要:可解释的人工智能(XAI)在医疗保健、金融和法律等决策关键领域变得越来越重要。反事实(CF)解释是XAI中的一个关键方法,通过建议对输入特征进行最小修改以导致不同的模型结果,为用户提供可操作的洞察。尽管取得了显著的进步,现有的CF生成方法往往难以平衡接近性、多样性和稳健性,限制了它们的实际应用。一个广泛采用的框架DiCE强调多样性但缺乏稳健性,使得CF解释对扰动和领域约束敏感。为了解决这些挑战,我们引入了DiCE-Extended,这是一个增强的CF解释框架,通过整合多目标优化技术来提高稳健性同时保持解释性。我们的方法引入了一个新的基于Dice-Sorensen系数的稳健性度量,确保在输入微小变化下具有稳定性。此外,我们使用加权损失组件(lambda_p,lambda_d,lambda_r)细化CF生成,以平衡接近性、多样性和稳健性。我们在多个基准数据集(COMPAS、Lending Club、German Credit、Adult Income)和多个机器学习后端(Scikit-learn、PyTorch、TensorFlow)上实证验证了DiCE-Extended。结果表明,与标准生成的DiCE解释相比,DiCE-Extended生成的CF具有更高的有效性、稳定性和与决策边界的对齐性。我们的研究结果突显了DiCE-Extended在生成更可靠和可解释的CF方面的潜力,适用于高危应用。未来的工作将探索自适应优化技术和领域特定约束,以进一步增强现实场景中的CF生成。