LLM2D
通过不确定性量化提高分子性质预测的反事实真实性
Improving Counterfactual Truthfulness for Molecular Property Prediction through Uncertainty Quantification
作者: Jonas Teufel, Annika Leinweber, Pascal Friederich
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.02606v1

摘要

arXiv:2504.02606v1 宣告类型: cross 摘要: 可解释的人工智能(xAI)干预旨在通过提高复杂黑盒模型的可解释性来提升用户信任,同时也作为从高性能预测系统中提取科学见解的一种手段。在分子属性预测中,通过突出显示输入分子结构中的最小变化如何导致预测属性的最大偏离,因果解释为我们提供了一种理解预测行为的方式。然而,只有当这些解释反映出真实底层属性的分布时,它们才有可能提供有意义的科学见解——我们将其定义为因果真实度。为了增加这种真实度,我们提出将不确定性估计技术集成到因果解释中,以筛选出高预测不确定性的因果候选。通过合成数据集和真实世界数据集的计算实验,我们证明了传统的不确定性估计方法,如集成和均值方差估计,已经显著降低了平均预测误差并增加了因果真实度,特别是在偏离分布的设置中。我们的结果突显了将不确定性估计纳入可解释性方法的重要性以及其潜在影响,特别是考虑到模型集成等低努力干预措施的相对高效果。