LLM2D
挑战性能与可解释性之间的权衡:可解释机器学习模型的评估
Challenging the Performance-Interpretability Trade-off: An Evaluation of Interpretable Machine Learning Models
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.14429v1

摘要

机器学习正在渗透到每一个可想象的领域,以促进数据驱动的决策支持。重点通常放在先进的黑箱模型上,因为它们被认为具有性能优势,而可解释模型则往往与较差的预测质量相关联。然而,最近提出了一代新的广义加性模型(GAMs),它们在捕捉复杂、非线性模式的同时,仍然保持完全可解释,具有良好的前景。为了揭示这些模型的优缺点,本研究在一组二十个表格基准数据集的基础上,比较了七种不同的GAMs与七种常用机器学习模型的预测性能。为了确保公平和稳健的模型比较,进行了广泛的参数搜索和交叉验证,共进行了68,500次模型运行。此外,本研究还定性地检查了模型的视觉输出,以评估其可解释性水平。基于这些结果,本文驳斥了只有黑箱模型才能实现高精度的误解,证明了对于表格数据,预测性能和模型可解释性之间并不存在严格的权衡。此外,本文还讨论了GAMs作为信息系统领域中强大的可解释模型的重要性,并从社会技术角度推导出未来工作的启示。