摘要
酶通过其催化的特定反应,对生命的所有方面都至关重要,使各种生物过程和适应成为可能。预测酶的功能对于理解生物通路、指导药物开发、提高生物产品产量以及促进进化研究至关重要。为了解决固有的复杂性,我们提出了一种基于酶催化反应的新方法来注释酶。这种方法提供了对特定反应的详细见解,并且可以适应新发现的反应,与传统的蛋白质家族或专家推导的反应类别分类方法不同。我们采用机器学习算法来分析酶反应数据集,对酶的功能提供更精细的视图。我们的评估利用了迄今为止最大的酶反应数据集,该数据集来自 SwissProt 和 Rhea 数据库,其中包含截至 2024 年 1 月 8 日的条目。我们将酶反应预测定义为一个检索问题,旨在根据酶对特定反应的催化能力对酶进行排序。利用我们的模型,我们可以为新的反应招募蛋白质,并预测新蛋白质中的反应,从而促进酶的发现和功能注释(https://github.com/WillHua127/ReactZyme)。