LLM2D

摘要

arXiv:2502.13398v1 类型: cross 摘要: 尽管最近取得了进展，但大多数分子优化的计算方法仅限于单属性或双属性优化任务，并且在扩展性和新型优化任务的一般适用性方面表现不佳。同时，大型语言模型（LLMs）在处理新型任务方面显示出卓越的跨领域一般适用性。为了展示LLMs在分子优化领域的潜力，我们引入了MoMUInstruct，这是第一个专注于复杂多属性分子优化任务的高质量指令调优数据集。利用MoMUInstruct，我们开发了GeLLM^3Os，一系列用于分子优化的指令调优LLMs。在5个领域内和5个领域外任务的广泛评估中，GeLLM^3Os持续超越最先进的基线模型。GeLLM^3Os在未见过的任务上的零样本泛化表现也非常出色，远超强大的闭源LLMs。这种强大的泛化能力展示了GeLLM^3Os作为分子优化基础模型的巨大潜力，使其能够在不进行资源密集型重训的情况下解决新型优化任务。MoMUInstruct、模型和代码可通过https://github.com/ninglab/GeLLMO访问。