摘要
arXiv:2503.23668v3 说明类型: 替换
概述: 当前的分子理解方法主要侧重于人类感知的描述性方面,提供了广泛的主题级见解。然而,参照方面——将分子概念与特定的结构成分联系起来——仍然被广泛忽视。为解决这一差距,我们提出了一个分子定位基准,旨在评估模型的参照能力。我们将分子定位与NLP、化学信息学和分子科学中的现有规范相结合,展示了NLP技术在科学发展领域推进分子理解中的潜力。此外,我们构建了迄今为止最大的分子理解基准,包含117k QA对,并开发了一个多代理定位原型作为概念验证。该系统在现有的模型,包括GPT-4o,中表现更佳,并且其定位输出已被集成以增强传统任务,如分子描述和ATC(解剖学、治疗学、化学)分类。