LLM2D

摘要

arXiv:2504.06196v1 宣布类型: 新闻摘要: 靶向药物开发是一个成本高且风险大的努力，经常受到高失败率的影响。为了解决这个问题，我们引入了TxGemma，这是一个高效的通用大型语言模型（LLMs）套件，能够进行治疗性质预测以及互动推理和解释性。与特定任务的模型不同，TxGemma能够从多种来源中综合信息，使其能够在整个治疗开发流程中得到广泛应用。该套件包括20亿、90亿和270亿参数的模型，这些模型是从Gemma-2在全面的小分子、蛋白质、核酸、疾病和细胞系数据集上微调而来的。在66个治疗开发任务中，TxGemma在64个任务上（其中45个任务表现出色）优于或达到了最先进的通用模型的性能，在50个任务上（其中26个任务表现出色）优于最先进的专业模型。微调TxGemma模型用于治疗下游任务，如临床试验不良事件预测，所需的训练数据量少于微调基础LLMs，使TxGemma适用于数据有限的应用。除了这些预测能力之外，TxGemma还配备了衔接通用LLM和专门的性质预测器之间的对话模型。这些模型使科学家能够以自然语言进行互动、基于分子结构提供机理上的推理，并参与科学讨论。在此基础上，我们进一步引入了Agentic-Tx，这是一种由Gemini 2.5驱动的通用治疗指导系统，能够进行推理、采取行动、管理各种工作流程并获取外部领域知识。Agentic-Tx在Humanity's Last Exam基准测试（化学与生物学）中超过了之前的领先模型，相对于o3-mini（高）有52.3%的相对改进，在GPQA（化学）中相对于o3-mini（高）有26.7%的改进，在ChemBench-Preference中有6.3%的改进，在ChemBench-Mini中有2.4%的改进。