摘要
arXiv:2503.24305v3 通告类型: 替换-交叉
摘要:小分子在生物医药、环境和农化领域中扮演着关键角色,每个领域都有独特的物理化学需求和成功标准。虽然生物医药研究得益于丰富的数据集和已建立的基准,但农化数据仍然稀缺,尤其是在物种特异性毒性方面。本文着重于ApisTox,这是最全面的蜜蜂(Apis mellifera)实验验证化学毒性数据集,蜜蜂是一种生态上至关重要的传粉者。我们使用一系列多元的机器学习方法来评估ApisTox,包括分子指纹、图内核和图神经网络,以及预训练模型。与MoleculeNet基准上的医药数据集的比较分析表明,ApisTox代表了一个独特的化学空间。在非医药数据集上的性能下降表明,当前仅在生物医药数据上训练的最先进的算法存在有限的泛化能力。我们的研究强调了需要更多多样化的数据集,并且需要针对农化领域进行专门模型开发的重要性。