摘要
arXiv:2504.17967v1 宣告类型: 新
摘要: 药物发现仍然是一个艰巨的挑战:超过90%的候选分子在临床评估中失败,而每项获批疗法的开发成本往往超过十亿美元。来自基因组学、转录组学、化学库和临床记录等异质数据流阻碍了统一的机制性洞察,并减缓了进程。与此同时,大型语言模型在推理和工具集成方面表现出色,但缺乏用于受监管、基于假设的工作流程所需的模块化专业化和迭代记忆能力。我们引入了PharmaSwarm,这是一种统一的多智能体框架,该框架协调专门的LLM“智能体”来提出、验证和细化针对新药物靶标和先导化合物的新假设。每个智能体访问特定的功能——自动基因组和表达分析;一个精心策划的生物医学知识图;途径富集和网络模拟;可解释的结合亲和力预测——而中央评估LLM持续根据生物可行性、新颖性、体外效果和安全性对提案进行排名。一个共享的记忆层捕获了经验证的洞察,并随着时间的推移微调底层子模型,从而生成一个自我改进的系统。PharmaSwarm可以在低代码平台上部署或基于Kubernetes的微服务。PharmaSwarm支持文献驱动的发现、组学指导的目标识别和市场驱动的再定位。我们还描述了一个严格的四阶段验证流水线,包括回顾性基准测试、独立的计算试验、实验测试和专家用户研究,以确保透明度、可重复性和实际影响。作为人工智能副驾,PharmaSwarm可以加速转化研究,并比传统流水线更高效地交付高置信度假设。