LLM2D
探究机器学习中可解释性和解释性的二重性
Investigating the Duality of Interpretability and Explainability in Machine Learning
作者: Moncef Garouani, Josiane Mothe, Ayah Barhrhouj, Julien Aligon
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.21356v1

摘要

arXiv:2503.21356v1 宣告类型:交叉 摘要:机器学习(ML)的快速发展导致了复杂且所谓的“黑盒”模型(如深度神经网络和集成方法)的广泛应用。这些模型展现出卓越的预测性能,使其成为社会各个领域关键决策不可或缺的工具。然而,它们固有的不透明性引发了对透明度和可解释性的担忧,使其成为不可靠的决策支持系统。为了克服这种高风险采纳的障碍,研究界的重点是开发方法来解释黑盒模型,以应对它们带来的挑战。努力集中在解释这些模型,而不是开发固有的可解释模型。然而,从一开始就设计固有的可解释模型可以为机器学习领域的负责任和有益应用铺平道路。在这份立场论文中,我们澄清了解释黑盒模型和采用固有的可解释模型之间的差距。我们强调了模型可解释性的重要性,并基于获得更好(即在预测性能方面更有效或更高效)且可靠的预测器的目的,提供了对最新混合学习方法的实验评估,这些方法将符号知识集成到神经网络预测器中。我们展示了如何使可解释的混合模型在不同领域可能取代黑盒模型。