LLM2D

摘要

arXiv:2505.00555v1 类别：交叉学科摘要：在生物统计学中，可解释的洞察力对于预测模型始终保持关键性，特别是在评估因果关系时，因为经典的统计学和机器学习方法往往能够提供内在的清晰度。尽管神经网络（NNs）在建模复杂生物数据方面提供了强大的能力，但它们传统的“黑箱”性质在需要高度关注健康的应用中带来了验证和信任的挑战。近期在机理可解释性（MI）方面的进展旨在解读这些网络学到的内部计算。本文探讨了在因果推断的生物统计学背景下将MI技术应用于NNs的方法。我们展示了可以利用MI工具进行以下工作：（1）探究和验证NNs学到的内部表示，例如在靶向最小损失估计（TMLE）这类框架中估计冗余函数；（2）发现并可视化网络处理不同类型输入时所采用的独特计算路径，这可能揭示出网络如何处理混杂因素和治疗手段；以及（3）提供方法学来比较统计学、机器学习和NN模型中学习到的机制和提取的洞察，促进对它们各自在因果生物统计分析中的优势和弱点的更深入理解。