摘要
arXiv:2502.08858v1 宣告类型: 新颖
摘要: 因果概率在现代决策中起着关键作用。本文解决了使用机器学习模型预测小数据子人群因果概率的挑战。Tian 和 Pearl 首次定义并推导出了三种基本的因果概率的紧界:必要性和充分性概率(PNS)、充分性概率(PS)和必要性概率(PN)。然而,估计这些概率需要每个子人群的特定实验和观察分布,而这通常在有限的总体数据中不可用或难以获得。我们假设每个子人群的因果概率由其特征决定。为了估计数据不足的子人群的因果概率,我们提出使用机器学习模型,这些模型可以从数据充足的子人群中获得见解。我们的多个机器学习模型的评估表明,在有足够的总体数据并选择了合适的机器学习模型和激活函数的情况下,PNS 可以有效地预测。通过模拟研究,我们展示了使用来自大约 2000 个子人群的数据,我们的多层感知机(MLP)模型使用 Mish 激活函数,在预测 32,768 个子人群的 PNS 时实现了约 0.02 的平均绝对误差(MAE)。