LLM2D
通过属性驱动的综合嵌入和GAN选择性改进分子生成
Improved Molecular Generation through Attribute-Driven Integrative Embeddings and GAN Selectivity
作者: Nandan Joshi, Erhan Guven
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2504.19040v1

摘要

arXiv:2504.19040v1 Announce Type: cross 摘要:药物发现和化学工程等领域对具有定制性质的分子的需求不断增长,推动了分子设计计算方法的发展。基于机器学习的从头分子生成方法最近引起了广泛关注。本文介绍了一种基于变换器的向量嵌入生成器,结合修改后的生成对抗网络(GAN),用于生成具有所需性质的分子。嵌入生成器利用了一种新型的分子描述符,将 Morgan 指纹与全局分子属性相结合,使变换器能够捕捉局部官能团和更广泛的分子特性。修改后的 GAN 生成器损失函数确保生成具有特定所需性质的分子。变换器在将分子描述符回译为 SMILES 字符串时达到了94%的重构准确率,验证了所提出的嵌入在生成任务中的实用性。该方法通过使用带有气味和非气味化合物标签的数据集生成新型气味分子得到了验证。通过修改范围损失函数,GAN 仅生成气味分子。这项工作强调了将新颖的向量嵌入与变换器以及修改后的 GAN 架构结合以加速定制分子发现的潜力,提供了一个强大的工具,适用于各种分子设计应用。