LLM2D
扩展决策谓词图以进行全面的孤立森林解释
Extending Decision Predicate Graphs for Comprehensive Explanation of Isolation Forest
作者: Matteo Ceschin, Leonardo Arrighi, Luca Longo, Sylvio Barbon Junior
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2505.04019v1

摘要

arXiv:2505.04019v1 通知类型: 新 摘要: 在现代机器学习中,解释预测模型的重要性已经得到了广泛认可。然而,除了模型可解释性之外,理解预处理方法同样至关重要。了解数据修改如何影响模型性能提升和潜在偏差,并促进可靠的工作流程是开发稳健的机器学习解决方案的必要条件。孤立森林(iForest)是一种广泛使用的异常检测技术,表现良好。随着基于树的学习器数量的增加,其有效性也会提高。然而,这也使异常选择和内点决策边界解释复杂化。本研究引入了一种新型的可解释人工智能(XAI)方法,以解决全球解释性的难题。具体而言,它旨在为异常检测提供一个全局解释,以解决其不透明性问题。我们的方法基于决策谓词图(DPG),该方法阐明了集成方法的逻辑,并提供了见解以及基于图的度量,以解释如何使用所提出的内点-异常传递分数(IOP-Score)识别样本为异常。我们的提议增强了 iForest 的可解释性,并提供了决策过程的全面视图,详细说明了哪些特征有助于异常识别以及模型如何利用这些特征。通过提供决策边界的见解和全面的特征使用视图,该方法推动了最先进的技术水平,从而促进了一个完全可解释的机器学习管道。