LLM2D

摘要

机器学习正在渗透到每一个可想象的领域，以促进数据驱动的决策支持。重点通常放在先进的黑箱模型上，因为它们被认为具有性能优势，而可解释模型则往往与较差的预测质量相关联。然而，最近提出了一代新的广义加性模型（GAMs），它们在捕捉复杂、非线性模式的同时，仍然保持完全可解释，具有良好的前景。为了揭示这些模型的优缺点，本研究在一组二十个表格基准数据集的基础上，比较了七种不同的GAMs与七种常用机器学习模型的预测性能。为了确保公平和稳健的模型比较，进行了广泛的参数搜索和交叉验证，共进行了68,500次模型运行。此外，本研究还定性地检查了模型的视觉输出，以评估其可解释性水平。基于这些结果，本文驳斥了只有黑箱模型才能实现高精度的误解，证明了对于表格数据，预测性能和模型可解释性之间并不存在严格的权衡。此外，本文还讨论了GAMs作为信息系统领域中强大的可解释模型的重要性，并从社会技术角度推导出未来工作的启示。