LLM2D

摘要

arXiv:2504.17967v1 宣告类型: 新摘要: 药物发现仍然是一个艰巨的挑战：超过90%的候选分子在临床评估中失败，而每项获批疗法的开发成本往往超过十亿美元。来自基因组学、转录组学、化学库和临床记录等异质数据流阻碍了统一的机制性洞察，并减缓了进程。与此同时，大型语言模型在推理和工具集成方面表现出色，但缺乏用于受监管、基于假设的工作流程所需的模块化专业化和迭代记忆能力。我们引入了PharmaSwarm，这是一种统一的多智能体框架，该框架协调专门的LLM“智能体”来提出、验证和细化针对新药物靶标和先导化合物的新假设。每个智能体访问特定的功能——自动基因组和表达分析；一个精心策划的生物医学知识图；途径富集和网络模拟；可解释的结合亲和力预测——而中央评估LLM持续根据生物可行性、新颖性、体外效果和安全性对提案进行排名。一个共享的记忆层捕获了经验证的洞察，并随着时间的推移微调底层子模型，从而生成一个自我改进的系统。PharmaSwarm可以在低代码平台上部署或基于Kubernetes的微服务。PharmaSwarm支持文献驱动的发现、组学指导的目标识别和市场驱动的再定位。我们还描述了一个严格的四阶段验证流水线，包括回顾性基准测试、独立的计算试验、实验测试和专家用户研究，以确保透明度、可重复性和实际影响。作为人工智能副驾，PharmaSwarm可以加速转化研究，并比传统流水线更高效地交付高置信度假设。