LLM2D

摘要

arXiv:2503.23668v3 说明类型: 替换概述: 当前的分子理解方法主要侧重于人类感知的描述性方面，提供了广泛的主题级见解。然而，参照方面——将分子概念与特定的结构成分联系起来——仍然被广泛忽视。为解决这一差距，我们提出了一个分子定位基准，旨在评估模型的参照能力。我们将分子定位与NLP、化学信息学和分子科学中的现有规范相结合，展示了NLP技术在科学发展领域推进分子理解中的潜力。此外，我们构建了迄今为止最大的分子理解基准，包含117k QA对，并开发了一个多代理定位原型作为概念验证。该系统在现有的模型，包括GPT-4o，中表现更佳，并且其定位输出已被集成以增强传统任务，如分子描述和ATC（解剖学、治疗学、化学）分类。