摘要
arXiv:2505.00169v1 宣告类型: cross
摘要: 深度生成模型在生成有效的3D分子结构方面显示出了显著的潜力,GEOM-Drugs数据集为此类基准测试提供了关键参照。然而,当前的评估协议存在严重的缺陷,包括不正确的价数定义、键阶计算中的错误,以及依赖于与参考数据不一致的势场。在此项工作中,我们重新审视了GEOM-Drugs,并提出了一种修正的评估框架:我们识别并修复了数据预处理中的问题,构建了化学上准确的价数表,并引入了基于GFN2-xTB的几何和能量基准。我们在此框架下重新训练并重新评估了几种领先的模型,提供了更新后的性能指标和对未来基准测试的实际建议。我们的结果强调了在3D分子生成中采用严格的化学评估方法的重要性。我们推荐的评估方法和GEOM-Drugs处理脚本可在 https://github.com/isayevlab/geom-drugs-3dgen-evaluation 获取。