摘要
arXiv:2504.06196v1 宣布类型: 新闻
摘要: 靶向药物开发是一个成本高且风险大的努力,经常受到高失败率的影响。为了解决这个问题,我们引入了TxGemma,这是一个高效的通用大型语言模型(LLMs)套件,能够进行治疗性质预测以及互动推理和解释性。与特定任务的模型不同,TxGemma能够从多种来源中综合信息,使其能够在整个治疗开发流程中得到广泛应用。该套件包括20亿、90亿和270亿参数的模型,这些模型是从Gemma-2在全面的小分子、蛋白质、核酸、疾病和细胞系数据集上微调而来的。在66个治疗开发任务中,TxGemma在64个任务上(其中45个任务表现出色)优于或达到了最先进的通用模型的性能,在50个任务上(其中26个任务表现出色)优于最先进的专业模型。微调TxGemma模型用于治疗下游任务,如临床试验不良事件预测,所需的训练数据量少于微调基础LLMs,使TxGemma适用于数据有限的应用。除了这些预测能力之外,TxGemma还配备了衔接通用LLM和专门的性质预测器之间的对话模型。这些模型使科学家能够以自然语言进行互动、基于分子结构提供机理上的推理,并参与科学讨论。在此基础上,我们进一步引入了Agentic-Tx,这是一种由Gemini 2.5驱动的通用治疗指导系统,能够进行推理、采取行动、管理各种工作流程并获取外部领域知识。Agentic-Tx在Humanity's Last Exam基准测试(化学与生物学)中超过了之前的领先模型,相对于o3-mini(高)有52.3%的相对改进,在GPQA(化学)中相对于o3-mini(高)有26.7%的改进,在ChemBench-Preference中有6.3%的改进,在ChemBench-Mini中有2.4%的改进。