LLM2D
构建和解释化学领域的机器学习模型:以硼基勒夏米酸的探索与设计为例
Constructing and explaining machine learning models for chemistry: example of the exploration and design of boron-based Lewis acids
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2501.01576v3

摘要

arXiv:2501.01576v3 宣传类型: 替换-交叉 摘要:将机器学习(ML)集成到化学中在分子设计中具有变革性的潜力,特别是针对具有目标性质的分子。然而,焦点往往集中在创建高效的预测模型上,有时会导致可解释性的牺牲。在本研究中,我们利用可解释的人工智能技术,探索基于硼的路易斯酸的理性设计,这些路易斯酸由于其电子接受性质,在有机反应中扮演着至关重要的角色。我们使用氟离子亲合性作为路易斯酸性的一个代理,基于化学上有意义的描述符开发了可解释的机器学习模型,包括从从Hammett线性自由能关系导出的取代基参数和从第一原理计算中获得的功能属性。通过将化学空间限制在明确定义的分子框架中,我们实现了高度准确的预测(平均绝对误差<6 kJ/mol),并在低数据状态下超过了传统的黑盒深度学习模型。模型的可解释性分析揭示了这些化合物中路易斯酸性的来源,并通过分子框架上取代基的性质和定位识别了可用于调节路易斯酸性的可操作杠杆。本工作将机器学习与化学家的思维方式结合起来,证明了可解释模型如何激发分子设计并增强对化学反应性的科学理解。