摘要
arXiv:2505.08508v1 宣言类型: 新
摘要:患者招募仍然是临床试验中的一个主要瓶颈,因此需要可扩展且自动化的解决方案。我们提出了TrialMatchAI,这是一种基于AI的推荐系统,通过处理异构临床数据,包括结构化记录和未结构化的医生笔记,自动进行患者与试验的匹配。该系统基于一个检索增强生成框架中的微调开源大规模语言模型(LLMs),确保透明性和可重复性,并维持适合临床环境的轻量级部署足迹。该系统规范化生物医学实体,使用结合了词法和语义相似性的混合搜索策略检索相关试验,重新排名结果,并使用医学链式推理进行标准级别的资格评估。该流程提供了可解释的输出,并具有可追溯的决策依据。在实际验证中,92%的肿瘤患者在前20个推荐中至少检索到一个相关试验。跨合成和真实临床数据集的评估确认了其最先进的性能,专家评估验证了标准级别资格分类的准确率超过90%,特别是在生物标志物驱动的匹配方面表现出色。为模块化和隐私设计,TrialMatchAI 支持 Phenopackets 标准化的数据,允许安全的本地部署,并允许随着更先进模型的出现无缝替换 LLM 组件。通过提高效率和可解释性,并提供轻量级、开源部署,TrialMatchAI 为精准医疗中的AI驱动的临床试验匹配提供了可扩展的解决方案。