LLM2D

摘要

重症监护室(ICU)患者的院内死亡率(IHM)预测对于及时干预和高效资源分配至关重要。虽然结构化的生理数据提供了定量见解，但临床记录提供了非结构化的、信息丰富的叙述性文本。本研究将这些数据模式与大型语言模型(LLM)生成的专家摘要相结合，以提高IHM预测的准确性。我们使用MIMIC-III数据库，分析了ICU入院前48小时的时序生理数据和临床记录。对每个患者的临床记录按时间顺序进行拼接，并使用Med42-v2 70B将其转换为专家摘要。我们开发了一个多表征学习框架来整合这些数据源，利用LLM增强文本数据，同时减轻对LLM预测的直接依赖，这可能会给不确定性量化和可解释性带来挑战。与仅使用时序数据的基线相比，该模型的AUPRC达到0.6156（+36.41%），AUROC达到0.8955（+7.64%）。专家摘要优于单独使用临床记录或时序数据，证明了LLM生成的知识的价值。性能提升在不同人口统计群体中保持一致，在代表性不足的人群中也有显著改善，突出了该框架公平应用的潜力。通过将LLM生成的摘要与结构化和非结构化数据相结合，该框架捕捉了互补的患者信息，显著提高了预测性能。这种方法展示了LLM增强危重症预测模型的潜力，强调了针对更广泛临床应用的领域特定验证和高级集成策略的必要性。