摘要
arXiv:2504.00485v2 通知类型: 替换交叉
摘要:心血管疾病仍然是全球导致死亡和疾病的主要原因,要求开发准确可靠的预测模型以促进早期检测和干预。尽管最新的工作集中在预测心血管疾病的各种机器学习方法上,但它们未能实现显著的准确性。为应对这一需求,我们应用了九种机器学习算法XGBoost、逻辑回归、决策树、随机森林、k近邻(KNN)、支持向量机(SVM)、高斯朴素贝叶斯(Gaussian NB)、自适应 boosting 和线性回归,基于一系列生理指标来预测心血管疾病。我们的方法涉及特征选择技术,以识别最相关的预测因子,旨在通过细化模型来提高性能和可解释性。我们使用了网格搜索超参数调整和交叉验证等过程来减少过拟合。此外,我们还开发了一种新型的投票系统,结合了特征选择技术,以推动心血管疾病的分类。此外,我们使用关键性能指标(包括准确率、精确率、召回率、F1分数和受试者操作特征曲线下的面积(ROC AUC))对模型进行了评估。在这些模型中,XGBoost表现出色,实现了99%的准确率、精确率、F1分数,98%的召回率和100%的ROC AUC。本研究为早期心血管疾病诊断和预防性医疗提供了有希望的方法。