LLM2D
稀疏性即一切:重新思考生物学路径导向的深度学习方法
Sparsity is All You Need: Rethinking Biological Pathway-Informed Approaches in Deep Learning
作者: Isabella Caranzano, Corrado Pancotti, Cesare Rollo, Flavio Sartori, Pietro Li\`o, Piero Fariselli, Tiziana Sanavia
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2505.04300v1

摘要

arXiv:2505.04300v1 跨类别公告类型 摘要:生物启发的神经网络通常利用通路注释来在生物医学应用中提高性能。我们假设通路整合的好处并非来源于其生物学相关性,而是来自于它引入的稀疏性。我们对所有相关基于通路的神经网络模型进行了全面分析,对每项研究的贡献进行了批判性评估。在此基础上,我们整理出了一部分代码公开的方法。在对生物学启发的最新深度学习模型和它们的随机化版本进行比较后,我们发现,在不同指标和数据集上,基于随机信息的模型表现与生物学启发的模型表现相当。值得注意的是,在分析的15种模型中有3种,随机化版本甚至优于其生物学启发的版本。此外,通路启发的模型在可解释性方面没有明显的优越性,因为随机化模型仍然能够识别出与疾病相关的生物标志物,尽管缺乏明确的通路信息。我们的研究结果表明,当前的方法可能过于依赖或未能充分探索通路注释。因此,我们提出了一种方法,该方法可以应用于不同的领域,并且可以作为系统比较新型通路启发模型与其随机化版本的稳健基准。这种方法使研究人员能够严格确定观察到的性能提升是否归因于生物学洞见。