LLM2D
适用于各种应用并可调的基于图的粗粒化方法用于机器学习力场
Universally applicable and tunable graph-based coarse-graining for Machine learning force fields
作者: Christoph Brunken, Sebastien Boyer, Mustafa Omar, Martin Maarand, Olivier Peltre, Solal Attias, Bakary N'tji Diallo, Anastasia Markina, Olaf Othersen, Oliver Bent
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.01973v1

摘要

arXiv:2504.01973v1 公告类型: cross 摘要: 对分子系统进行粗粒化(Coarse-grained, CG)力场方法是模拟大型生物大分子的关键工具,因此对于生物分子系统的表征至关重要。尽管近年来基于深度学习(Deep Learning, DL)的全原子力场模型有了显著改进,但我们观察到并分析了目前基于DL的CG模拟方法中存在的重要局限性。在这项工作中,我们提出了首个可移植的基于DL的CG力场方法(即,不限于仅为某一特定系统类型设计的方法),适用于广泛的生物系统。为了实现这一目标,我们的CG算法不依赖于硬编码的规则,并被调整为输出优化的粗粒化系统,以最小化真实CG力量的统计噪声,从而显著改善了模型训练。我们的力场模型也是首个基于MACE架构的CG变体,并在一种通过新方法创建的大型生物系统碎片化数据集上进行了训练,该方法涵盖了蛋白质、RNA和脂质化学。我们证明了我们的模型可以在分子动力学模拟中应用,以获得各种系统稳定且定性准确的轨迹,同时讨论了其中一些我们观察到可靠性有限的案例。