摘要
arXiv:2505.00555v1 类别:交叉学科
摘要:在生物统计学中,可解释的洞察力对于预测模型始终保持关键性,特别是在评估因果关系时,因为经典的统计学和机器学习方法往往能够提供内在的清晰度。尽管神经网络(NNs)在建模复杂生物数据方面提供了强大的能力,但它们传统的“黑箱”性质在需要高度关注健康的应用中带来了验证和信任的挑战。近期在机理可解释性(MI)方面的进展旨在解读这些网络学到的内部计算。本文探讨了在因果推断的生物统计学背景下将MI技术应用于NNs的方法。
我们展示了可以利用MI工具进行以下工作:(1)探究和验证NNs学到的内部表示,例如在靶向最小损失估计(TMLE)这类框架中估计冗余函数;(2)发现并可视化网络处理不同类型输入时所采用的独特计算路径,这可能揭示出网络如何处理混杂因素和治疗手段;以及(3)提供方法学来比较统计学、机器学习和NN模型中学习到的机制和提取的洞察,促进对它们各自在因果生物统计分析中的优势和弱点的更深入理解。