LLM2D
从基因表达谱通过深度学习生成具有活性潜力的分子
De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning
作者: Chen Li, Yoshihiro Yamanishi
发布日期: 4/18/2025
arXiv ID: oai:arXiv.org:2412.19422v2

摘要

arXiv:2412.19422v2 宣告类型: 替换交叉 摘要: 在药物发现过程中,从头生成类似先导的分子是一个具有挑战性的任务。大多数先前研究中的方法通过分析分子图或简化分子输入线输入系统(SMILES)字符串来学习分子结构的语义和语法;然而,它们并未考虑到由基因和蛋白质组成的生物系统对药物的响应。在本研究中,我们提出了一种混合神经网络HNN2Mol,它可以利用基因表达谱来生成具有期望表型的分子结构以供任意目标蛋白质使用。在该算法中,使用变分自编码器作为特征提取器,以学习基因表达谱的潜在特征分布。然后,利用长短期记忆网络作为化学生成器,生成满足特征提取器提取出的基因表达谱特征条件的语法正确的SMILES字符串。实验结果和案例研究证明,提出的HNN2Mol模型可以生成具有潜在生物活性和类药物性质的新分子。