LLM2D
利用深度学习解锁基因组规模代谢网络中缺失反应的可推广框架
A generalizable framework for unlocking missing reactions in genome-scale metabolic networks using deep learning
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13259v1

摘要

代谢过程知识的不完整性阻碍了基因组规模代谢模型(GEMs)的准确性,进而影响了系统生物学和代谢工程的发展。现有的填补方法通常依赖于表型数据来最小化计算预测与实验结果之间的差异。然而,在实验数据和注释基因组可用之前,缺乏一种自动且精确的初始状态GEMs填补方法。在本研究中,我们介绍了CLOSEgaps,一种基于深度学习的工具,通过将填补问题建模为GEMs中的超边预测问题来解决这一难题。具体而言,CLOSEgaps将代谢网络映射为超图,并学习其超拓扑特征,以利用假设反应识别缺失的反应和间隙。这种创新方法允许对代谢网络中的已知和假设反应进行特征化和整理。广泛的结果表明,CLOSEgaps能够准确填补各种GEMs中超过96%的人工引入的间隙。此外,CLOSEgaps提高了24个GEMs的表型预测,并在两种生物体中显著提高了四种关键代谢物(乳酸、乙醇、丙酸和琥珀酸)的产量。作为一种广泛适用于任何GEM的解决方案,CLOSEgaps代表了自动化填补过程和揭示反应与观察到的代谢表型之间缺失连接的有前景的模型。