摘要
arXiv:2501.19137v1 宣布类型: cross
摘要:分子图学习利用了分子结构及其结构附带特征中的信息。迄今为止,人们在这方面做了大量工作,偏向于结构或特征,目的是使偏向有助于性能的提升。确定数据集更倾向于哪种信息源,以及因此如何处理该数据集的问题仍然存在。在此,我们提出了噪声-噪声比率差异 (NNRD),这是一种定量指标,用于判断结构或特征中哪个包含更多有用信息。通过独立地对特征和结构进行迭代噪声处理,使另一方保持不变,NNRD 测量每个信息量的退化情况。我们在一系列分子任务中应用了 NNRD,并展示了其与信息丢失对应良好,得到了比简单性能聚合更直观且更具表达性的结果。我们未来的工作将重点扩展数据领域、任务和类型,并精炼我们的基线模型选择。