摘要
arXiv:2410.10516v3 宣告类型:替换-交叉
摘要:分子生成和分子性质预测对于药物发现至关重要,但它们通常独立开发。受到最近研究的启发,这些研究表明扩散模型作为一种生成方法可以学习有意义的数据表示,从而提高预测任务,我们探索了在分子领域开发一个统一的生成模型的可能性,该模型能够有效地解决分子生成和性质预测任务。然而,由于固有的不一致性,将这些任务结合起来极具挑战性,使简单的多任务学习无效。为了解决这个问题,我们提出了UniGEM,这是第一个成功集成分子生成和性质预测的统一模型,在两个任务中均表现出色。我们的关键创新在于一种新颖的两阶段生成过程,在形成分子骨架后,在后期阶段激活预测任务。我们还通过创新的训练策略进一步平衡任务。严格的理论分析和全面的实验表明,我们的改进对于两个任务都具有显着的提升。UniGEM背后的原理也有望在更广泛的领域中发挥作用,包括自然语言处理和计算机视觉。