摘要
arXiv:2505.00290v1 交叉声明类型:交叉
摘要:分子气味预测是利用分子结构来预测其气味的过程。虽然准确预测仍然是一个挑战,但人工智能模型可以建议潜在的气味。然而,现有的方法通常依赖于基本描述符或手工制作的指纹,这些描述符缺乏表现力,阻碍了有效的学习。此外,这些方法还面临着严重的类不平衡问题,限制了AI模型的训练效果。为了解决这些挑战,我们提出了一种特征贡献驱动的分层多特征映射网络(HMFNet)。具体来说,我们引入了一种细粒度的局部多层次特征提取模块(LMFE),它在原子级别进行深层特征提取,捕捉到气味预测至关重要的详细特征。为了增强原子特征的提取,我们结合了谐波调制特征映射(HMFM),该模块动态学习特征的重要性和频率调制,提高模型捕捉相关模式的能力。此外,我们设计了一种全局多层次特征提取模块(GMFE),用于从分子图拓扑学习全局特征,从而使模型能够充分利用全局信息并增强其气味预测的辨别力。为了进一步缓解类不平衡的问题,我们提出了化学知情损失(CIL)。实验结果表明,我们的方法显著提高了各种深度学习模型的性能,突显了其在分子结构表示和加速人工智能驱动技术开发方面的发展潜力。