摘要
arXiv:2505.06949v1 宣布类型: 新
摘要: 已知图和结构因果模型在组织生物医学知识和估计因果效应方面各具优势,但两者仍保持很大程度上的分离:已知图编码定性的关系,关注事实和演绎推理,而缺乏正式的概率语义;因果模型则缺乏与已知图中的背景知识的集成,并且不具有已知图提供的演绎推理能力。为弥合这一差距,我们提出了因果知识图谱(CKGs)的新颖形式,该形式扩展了已知图中的正式因果语义,同时保持其演绎推理能力并使有效的因果推理成为可能。CKGs 支持通过明确标记因果边进行反混淆,并促进与编码和推导出的背景知识一致的假设制定。我们构建了一个药物-疾病因果知识图谱(DD-CKG),整合了疾病进展途径、药物适应症、副作用以及疾病层次分类,以实现自动化大规模中介分析。应用于UK BIOBANK和MIMIC-IV队列,我们测试了药物是否在适应症和下游疾病进展之间充当媒介效应,并根据DD-CKG推断出的潜在混杂因素进行了调整。我们的方法成功地以高精度再现了已知的不良反应,同时识别了以前未记录的重要候选不良反应。进一步通过副作用相似性分析验证表明,将我们预测的药物效应与现有的数据库结合使用显著提高了对共享药物适应症的预测能力,支持了我们新颖发现的临床相关性。这些结果证明了我们的方法提供了一种可扩展的知识驱动的因果推理框架。