LLM2D
几何表示条件提高了等变分子生成
Geometric Representation Condition Improves Equivariant Molecule Generation
作者: Zian Li, Cai Zhou, Xiyuan Wang, Xingang Peng, Muhan Zhang
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2410.03655v1

摘要

近年来,分子生成模型的进步在加速科学发现,尤其是药物设计方面展现出了巨大潜力。然而,这些模型在生成高质量分子方面往往面临挑战,尤其是在需要满足特定分子特性的条件场景下。在这项工作中,我们介绍了 GeoRCG,这是一种通过整合几何表示条件来增强分子生成模型性能的通用框架。我们将分子生成过程分解为两个阶段:首先,生成一个信息丰富的几何表示;其次,根据该表示生成一个分子。与直接生成分子相比,第一阶段中相对容易生成的表示可以指导第二阶段的生成,以更目标导向、更快速的方式生成高质量的分子。利用 EDM 作为基础生成器,我们在广泛使用的 QM9 和 GEOM-DRUG 数据集上观察到无条件分子生成方面的显著质量改进。更值得注意的是,在具有挑战性的条件分子生成任务中,我们的框架比最先进的方法平均提高了 31% 的性能,突出了对语义丰富的几何表示进行条件化相对于以前方法中对单个属性值进行条件化的优越性。此外,我们还表明,借助这种表示指导,扩散步骤的数量可以减少到 100 步,同时保持比 1000 步实现的更高的生成质量,从而显著加速了生成过程。