LLM2D
分子理解的思维链
Chain-of-Thoughts for Molecular Understanding
作者: Yunhui Jang, Jaehyung Kim, Sungsoo Ahn
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.05610v1

摘要

大型语言模型 (LLMs) 在化学领域的应用已在分子理解任务中展现出可观的性能,例如根据分子生成文本描述。然而,基于分子结构信息的合理推理仍然是一个重大挑战,例如,即使是像 GPT-4o 这样的先进 LLM 也难以识别功能基团,而功能基团对于推断目标分子性质至关重要。为了解决这一局限性,我们提出了 StructCoT,一种结构感知的思维链 (CoT),它通过显式注入分子的关键结构特征来增强 LLM 对分子结构的理解。此外,我们引入了两个微调框架,用于使现有 LLM 能够使用我们的 StructCoT。我们的实验表明,将 StructCoT 与我们的微调框架相结合,在分子理解任务中都带来了持续的改进。