摘要
arXiv:2505.07036v1 Announce Type: cross
摘要:糖尿病仍然是全球性的重大健康挑战,导致严重的并发症,如肾病、视力丧失和心脏病。机器学习(ML)在医疗保健中的应用使疾病预测更加高效和准确,为早期干预和患者支持提供了途径。我们的研究介绍了一种创新的糖尿病预测框架,综合利用了传统的机器学习技术,如逻辑回归、支持向量机(SVM)、朴素贝叶斯和随机森林,以及先进的集成方法,如AdaBoost、梯度提升、额外树和XGBoost。我们方法的核心在于开发了一种新的模型,即DNet,这是一种结合了卷积神经网络(CNN)和长短期记忆(LSTM)层的混合架构,用于有效的特征提取和序列学习。DNet模型包括一个初始的卷积块来捕获关键特征,随后是一个具有跳连接的残差块,以促进高效的信息流动。我们使用了批归一化和dropout进行稳健的正则化,而LSTM层则捕捉数据中的时间依赖性。通过使用Kaggle提供的真实世界糖尿病数据集,我们的模型评估涵盖了交叉验证精度、精确度、召回率、F1分数和ROC-AUC。在所有模型中,DNet展示了最高的有效性,准确率为99.79%,AUC-ROC为99.98%,确立了其在糖尿病预测方面的优越潜力。这种强大的混合架构展示了将CNN和LSTM层相结合的价值,强调了其在医疗诊断和疾病预测任务中的适用性。