LLM2D

摘要

arXiv:2505.04019v1 通知类型: 新摘要: 在现代机器学习中，解释预测模型的重要性已经得到了广泛认可。然而，除了模型可解释性之外，理解预处理方法同样至关重要。了解数据修改如何影响模型性能提升和潜在偏差，并促进可靠的工作流程是开发稳健的机器学习解决方案的必要条件。孤立森林（iForest）是一种广泛使用的异常检测技术，表现良好。随着基于树的学习器数量的增加，其有效性也会提高。然而，这也使异常选择和内点决策边界解释复杂化。本研究引入了一种新型的可解释人工智能（XAI）方法，以解决全球解释性的难题。具体而言，它旨在为异常检测提供一个全局解释，以解决其不透明性问题。我们的方法基于决策谓词图（DPG），该方法阐明了集成方法的逻辑，并提供了见解以及基于图的度量，以解释如何使用所提出的内点-异常传递分数（IOP-Score）识别样本为异常。我们的提议增强了 iForest 的可解释性，并提供了决策过程的全面视图，详细说明了哪些特征有助于异常识别以及模型如何利用这些特征。通过提供决策边界的见解和全面的特征使用视图，该方法推动了最先进的技术水平，从而促进了一个完全可解释的机器学习管道。