摘要
arXiv:2504.06306v1 公告类型: cross
摘要:癌症仍然是全球健康面临的重大挑战,并且是导致大量死亡的主要原因之一。本研究利用机器学习(ML)来预测具有转移模式的癌症患者的生存率,使用了包含25,775名患者(涵盖27种癌症类型)的综合MSK-MET数据集,其中包括基因组和临床数据。我们评估了五种ML模型——XGBoost、朴素贝叶斯、决策树、逻辑回归和随机森林,采用了超参数调优和网格搜索方法。XGBoost在曲线下面积(AUC)上表现最佳,达到了0.82。为了增强模型的可解释性,我们应用了SHapley加性解释(SHAP),揭示了关键预测因素,如转移部位数量、肿瘤突变负担、基因组改变的比例以及器官特异性转移。进一步通过Kaplan-Meier曲线、Cox比例风险模型和XGBoost生存分析进行了生存分析,确定了患者结果的重要预测因素,为临床工作者提供了可操作的见解。这些发现有助于个性化预后和治疗计划,最终改善患者的护理。