LLM2D

摘要

arXiv:2406.06777v5 通告类型: replace-cross 摘要：具有强大任务处理能力的大语言模型（LLMs）已经在多个领域展现了显著的进步，超越了自然语言理解的范畴。然而，它们在化学领域的专业能力仍然受限，特别是在解决与分子相关的专业任务方面。这种挑战归因于它们仅使用普通的文本表示（如SMILES字符串）理解分子时固有的局限性。在本研究中，我们旨在通过为LLMs配备一个多模态外部模块，即MolX，来增强其理解分子的能力。特别地，我们不是直接使用SMILES字符串来表示分子，而是使用特定的编码器从SMILES字符串和2D分子图表示中提取细粒度特征，以输入给LLM。此外，还整合了一个手工设计的分子指纹，以利用其嵌入的专业知识。为了建立MolX与LLM文本输入空间之间的对齐，整个模型中的LLM在包括一系列任务的多样化策略下进行了预训练。实验证明，与不进行LLM微调的基准方法相比，我们的提议方法在4个下游的分子相关任务上表现出色，包括分子到文本的翻译和逆合成反应，分别只有0.53%和0.82%的可训练参数数量。