LLM2D

摘要

arXiv:2504.06306v1 公告类型: cross 摘要：癌症仍然是全球健康面临的重大挑战，并且是导致大量死亡的主要原因之一。本研究利用机器学习（ML）来预测具有转移模式的癌症患者的生存率，使用了包含25,775名患者（涵盖27种癌症类型）的综合MSK-MET数据集，其中包括基因组和临床数据。我们评估了五种ML模型——XGBoost、朴素贝叶斯、决策树、逻辑回归和随机森林，采用了超参数调优和网格搜索方法。XGBoost在曲线下面积（AUC）上表现最佳，达到了0.82。为了增强模型的可解释性，我们应用了SHapley加性解释（SHAP），揭示了关键预测因素，如转移部位数量、肿瘤突变负担、基因组改变的比例以及器官特异性转移。进一步通过Kaplan-Meier曲线、Cox比例风险模型和XGBoost生存分析进行了生存分析，确定了患者结果的重要预测因素，为临床工作者提供了可操作的见解。这些发现有助于个性化预后和治疗计划，最终改善患者的护理。