LLM2D

摘要

arXiv:2503.21241v1 类型: cross 摘要：准确的患者死亡率预测能够实现有效的风险分层，从而制定个性化治疗方案并改善患者预后。然而，在医疗保健中预测死亡率仍然是一项重大挑战，现有研究往往集中于特定的疾病或有限的预测变量集。本研究通过使用MIMIC-III数据库评估机器学习模型在全因院内死亡率预测方面的性能，并采用全面的特征工程方法。在临床专业知识和文献的指导下，我们提取了关键特征，如生命体征（例如，心率、血压）、实验室结果（例如，肌酐、血糖）和人口统计信息。随机森林模型表现最优，AUC为0.94，显著优于其他机器学习和深度学习方法。这表明随机森林在处理高维、嘈杂的临床数据方面具有稳健性，并且有潜力开发有效的临床决策支持工具。我们的研究结果强调了精细特征工程对于准确死亡率预测的重要性。最后，我们讨论了临床应用的含义，并提出了未来方向，包括增强模型的稳健性以及为特定疾病定制预测模型。