LLM2D
DeepProtein:蛋白质序列学习的深度学习库与基准测试
DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning
作者: Jiaqing Xie, Yue Zhao, Tianfan Fu
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2410.02023v1

摘要

近年来,深度学习彻底改变了蛋白质科学领域,推动了预测蛋白质性质、结构折叠和相互作用方面的进步。本文介绍了DeepProtein,一个专门为蛋白质相关任务设计的综合且用户友好的深度学习库。DeepProtein集成了几种最先进的神经网络架构,包括卷积神经网络(CNN)、循环神经网络(RNN)、Transformer、图神经网络(GNN)和图Transformer(GT)。它提供了用户友好的界面,方便领域研究人员将深度学习技术应用于蛋白质数据。此外,我们整理了一个基准,评估了这些神经架构在各种蛋白质任务上的表现,包括蛋白质功能预测、蛋白质定位预测和蛋白质-蛋白质相互作用预测,展示了其优越的性能和可扩展性。此外,我们提供了详细的文档和教程,以促进可访问性并鼓励可重复研究。该库扩展自一个著名的药物发现库DeepPurpose,并可在https://github.com/jiaqingxie/DeepProtein/tree/main公开获取。