摘要
arXiv:2406.06777v5 通告类型: replace-cross
摘要:具有强大任务处理能力的大语言模型(LLMs)已经在多个领域展现了显著的进步,超越了自然语言理解的范畴。然而,它们在化学领域的专业能力仍然受限,特别是在解决与分子相关的专业任务方面。这种挑战归因于它们仅使用普通的文本表示(如SMILES字符串)理解分子时固有的局限性。在本研究中,我们旨在通过为LLMs配备一个多模态外部模块,即MolX,来增强其理解分子的能力。特别地,我们不是直接使用SMILES字符串来表示分子,而是使用特定的编码器从SMILES字符串和2D分子图表示中提取细粒度特征,以输入给LLM。此外,还整合了一个手工设计的分子指纹,以利用其嵌入的专业知识。为了建立MolX与LLM文本输入空间之间的对齐,整个模型中的LLM在包括一系列任务的多样化策略下进行了预训练。实验证明,与不进行LLM微调的基准方法相比,我们的提议方法在4个下游的分子相关任务上表现出色,包括分子到文本的翻译和逆合成反应,分别只有0.53%和0.82%的可训练参数数量。