LLM2D
增强特征的机器学习方法在医疗数据中的全因 mortality 预测
Feature-Enhanced Machine Learning for All-Cause Mortality Prediction in Healthcare Data
作者: HyeYoung Lee, Pavel Tsoi
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.21241v1

摘要

arXiv:2503.21241v1 类型: cross 摘要:准确的患者死亡率预测能够实现有效的风险分层,从而制定个性化治疗方案并改善患者预后。然而,在医疗保健中预测死亡率仍然是一项重大挑战,现有研究往往集中于特定的疾病或有限的预测变量集。本研究通过使用MIMIC-III数据库评估机器学习模型在全因院内死亡率预测方面的性能,并采用全面的特征工程方法。在临床专业知识和文献的指导下,我们提取了关键特征,如生命体征(例如,心率、血压)、实验室结果(例如,肌酐、血糖)和人口统计信息。随机森林模型表现最优,AUC为0.94,显著优于其他机器学习和深度学习方法。这表明随机森林在处理高维、嘈杂的临床数据方面具有稳健性,并且有潜力开发有效的临床决策支持工具。我们的研究结果强调了精细特征工程对于准确死亡率预测的重要性。最后,我们讨论了临床应用的含义,并提出了未来方向,包括增强模型的稳健性以及为特定疾病定制预测模型。