LLM2D

摘要

arXiv:2505.08508v1 宣言类型: 新摘要：患者招募仍然是临床试验中的一个主要瓶颈，因此需要可扩展且自动化的解决方案。我们提出了TrialMatchAI，这是一种基于AI的推荐系统，通过处理异构临床数据，包括结构化记录和未结构化的医生笔记，自动进行患者与试验的匹配。该系统基于一个检索增强生成框架中的微调开源大规模语言模型（LLMs），确保透明性和可重复性，并维持适合临床环境的轻量级部署足迹。该系统规范化生物医学实体，使用结合了词法和语义相似性的混合搜索策略检索相关试验，重新排名结果，并使用医学链式推理进行标准级别的资格评估。该流程提供了可解释的输出，并具有可追溯的决策依据。在实际验证中，92%的肿瘤患者在前20个推荐中至少检索到一个相关试验。跨合成和真实临床数据集的评估确认了其最先进的性能，专家评估验证了标准级别资格分类的准确率超过90%，特别是在生物标志物驱动的匹配方面表现出色。为模块化和隐私设计，TrialMatchAI 支持 Phenopackets 标准化的数据，允许安全的本地部署，并允许随着更先进模型的出现无缝替换 LLM 组件。通过提高效率和可解释性，并提供轻量级、开源部署，TrialMatchAI 为精准医疗中的AI驱动的临床试验匹配提供了可扩展的解决方案。