LLM2D

摘要

arXiv:2504.19027v1 宣布类型: 新摘要：可解释的人工智能（XAI）在医疗保健、金融和法律等决策关键领域变得越来越重要。反事实（CF）解释是XAI中的一个关键方法，通过建议对输入特征进行最小修改以导致不同的模型结果，为用户提供可操作的洞察。尽管取得了显著的进步，现有的CF生成方法往往难以平衡接近性、多样性和稳健性，限制了它们的实际应用。一个广泛采用的框架DiCE强调多样性但缺乏稳健性，使得CF解释对扰动和领域约束敏感。为了解决这些挑战，我们引入了DiCE-Extended，这是一个增强的CF解释框架，通过整合多目标优化技术来提高稳健性同时保持解释性。我们的方法引入了一个新的基于Dice-Sorensen系数的稳健性度量，确保在输入微小变化下具有稳定性。此外，我们使用加权损失组件（lambda_p，lambda_d，lambda_r）细化CF生成，以平衡接近性、多样性和稳健性。我们在多个基准数据集（COMPAS、Lending Club、German Credit、Adult Income）和多个机器学习后端（Scikit-learn、PyTorch、TensorFlow）上实证验证了DiCE-Extended。结果表明，与标准生成的DiCE解释相比，DiCE-Extended生成的CF具有更高的有效性、稳定性和与决策边界的对齐性。我们的研究结果突显了DiCE-Extended在生成更可靠和可解释的CF方面的潜力，适用于高危应用。未来的工作将探索自适应优化技术和领域特定约束，以进一步增强现实场景中的CF生成。