摘要
arXiv:2503.23668v2 宣告类型: 替换
摘要: 当前的分子理解方法主要关注人类感知的描述方面,提供了广泛的主题级洞见。然而,指称方面——将分子概念与具体的结构组件联系起来——仍然 largely unexplored。为了解决这一差距,我们提出了一种分子 grounding 基准测试,旨在评估模型的指称能力。我们将分子 grounding 与 NLP、化学信息学和分子科学中的既定规范相一致,展示了自然语言处理技术在科学人工智能运动中促进分子理解的潜力。此外,我们构建了迄今为止规模最大的分子理解基准测试,包含 79,000 个问答对,并开发了一个多智能体 grounding 原型作为概念验证。该系统在现有模型(包括 GPT-4o)中表现出色,并将其 grounding 输出集成到传统的任务中,如分子图像说明和 ATC(解剖学、治疗学、化学分类)分类中。