LLM2D
基于大型语言模型的化学计算增强科学文献验证
Validation of the Scientific Literature via Chemputation Augmented by Large Language Models
作者: Sebastian Pagel, Michael Jirasek, Leroy Cronin
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.06384v1

摘要

化学计算是指使用通用符号语言对化学机器人进行编程以进行实验的过程,但由于存在歧义,文献可能存在错误且难以阅读。大型语言模型 (LLM) 在各个领域都展现出非凡的能力,包括自然语言处理、机器人控制,以及最近的化学。尽管在标准化合成化学数据的报告和收集方面取得了重大进展,但自动重现报告的合成仍然是一项劳动密集型任务。在这项工作中,我们介绍了一种基于 LLM 的化学研究代理工作流程,旨在用于自动验证合成文献程序。我们的工作流程可以自动从大量文档中提取合成程序和分析数据,将这些程序转换为通用的 XDL 代码,在特定于硬件的设置中模拟程序的执行,并最终在用于合成化学的 XDL 控制的机器人系统上执行程序。这展示了基于 LLM 的工作流程在使用化学计算器进行自主化学合成方面的潜力。由于 XDL 的抽象性,这种方法是安全、可靠且可扩展的,因为幻觉将无法计算,并且 XDL 可以被验证和加密。与之前的努力不同,之前的努力要么只处理工作流程的一部分,要么依赖于僵化的硬编码规则,要么缺乏物理系统的验证,我们的方法提供了四个直接从合成文献执行的合成现实示例。我们预计,我们的工作流程将显着增强机器人驱动的合成化学研究中的自动化,简化数据提取,提高合成和实验化学的重现性、可扩展性和安全性。