摘要
arXiv:2505.09969v1 Announce Type: cross
摘要:本文提出了一种基于机器学习的框架,用于使用包含303个样本和14个特征的心脏疾病数据集进行心脏疾病预测。该方法包括数据预处理、模型训练和使用逻辑回归、K-最近邻(KNN)和随机森林三种分类器进行评估。通过GridSearchCV和RandomizedSearchCV进行超参数调优以提升模型性能。随机森林分类器在其他模型中脱颖而出,准确率达到91%,F1分数为0.89。精确率、召回率和混淆矩阵等评估指标显示出各分类表现的均衡性。所提出的模型展示了通过有效预测心脏疾病来辅助临床决策的强大潜力。数据集规模和普适性等限制强调了未来研究需要使用更大、更具多样性的数据集进行的重要性。本文突显了机器学习在医疗保健领域的应用价值,为预测诊断的进步提供了新的见解。