LLM2D

摘要

大型语言模型（LLMs）在各种自然语言任务中展现了显著的能力，并越来越多地应用于医疗健康领域。本研究展示了一种通过流式人机对话实现的新型LLM驱动的疾病风险评估方法，消除了传统机器学习方法所需的编程需求。在COVID-19严重程度风险评估的案例研究中，我们使用少量自然语言示例对预训练生成型LLMs（如Llama2-7b和Flan-t5-xl）进行微调，并将其性能与使用表格数据从头训练的传统分类器（如逻辑回归、XGBoost、随机森林）在各种实验设置下进行比较。我们开发了一款移动应用程序，该应用以这些微调后的LLMs作为其生成式AI（GenAI）核心，促进临床医生与患者之间的实时互动，通过对话界面提供无代码风险评估。这种集成不仅允许使用流式问答作为输入，还提供了从LLM注意力层导出的个性化特征重要性分析，增强了风险评估的可解释性。通过在有限数量的微调样本下获得高曲线下面积（AUC）分数，我们的结果展示了生成型LLMs在低数据环境下超越判别分类方法的潜力，突显了其在现实世界中的适应性和有效性。本研究旨在填补利用生成型LLMs进行交互式无代码风险评估的现有空白，并鼓励在这一新兴领域的进一步研究。