摘要
大型语言模型(LLMs)在各种自然语言任务中展现了显著的能力,并越来越多地应用于医疗健康领域。本研究展示了一种通过流式人机对话实现的新型LLM驱动的疾病风险评估方法,消除了传统机器学习方法所需的编程需求。在COVID-19严重程度风险评估的案例研究中,我们使用少量自然语言示例对预训练生成型LLMs(如Llama2-7b和Flan-t5-xl)进行微调,并将其性能与使用表格数据从头训练的传统分类器(如逻辑回归、XGBoost、随机森林)在各种实验设置下进行比较。我们开发了一款移动应用程序,该应用以这些微调后的LLMs作为其生成式AI(GenAI)核心,促进临床医生与患者之间的实时互动,通过对话界面提供无代码风险评估。这种集成不仅允许使用流式问答作为输入,还提供了从LLM注意力层导出的个性化特征重要性分析,增强了风险评估的可解释性。通过在有限数量的微调样本下获得高曲线下面积(AUC)分数,我们的结果展示了生成型LLMs在低数据环境下超越判别分类方法的潜力,突显了其在现实世界中的适应性和有效性。本研究旨在填补利用生成型LLMs进行交互式无代码风险评估的现有空白,并鼓励在这一新兴领域的进一步研究。