LLM2D

摘要

arXiv:2505.07036v1 Announce Type: cross 摘要：糖尿病仍然是全球性的重大健康挑战，导致严重的并发症，如肾病、视力丧失和心脏病。机器学习（ML）在医疗保健中的应用使疾病预测更加高效和准确，为早期干预和患者支持提供了途径。我们的研究介绍了一种创新的糖尿病预测框架，综合利用了传统的机器学习技术，如逻辑回归、支持向量机（SVM）、朴素贝叶斯和随机森林，以及先进的集成方法，如AdaBoost、梯度提升、额外树和XGBoost。我们方法的核心在于开发了一种新的模型，即DNet，这是一种结合了卷积神经网络（CNN）和长短期记忆（LSTM）层的混合架构，用于有效的特征提取和序列学习。DNet模型包括一个初始的卷积块来捕获关键特征，随后是一个具有跳连接的残差块，以促进高效的信息流动。我们使用了批归一化和dropout进行稳健的正则化，而LSTM层则捕捉数据中的时间依赖性。通过使用Kaggle提供的真实世界糖尿病数据集，我们的模型评估涵盖了交叉验证精度、精确度、召回率、F1分数和ROC-AUC。在所有模型中，DNet展示了最高的有效性，准确率为99.79%，AUC-ROC为99.98%，确立了其在糖尿病预测方面的优越潜力。这种强大的混合架构展示了将CNN和LSTM层相结合的价值，强调了其在医疗诊断和疾病预测任务中的适用性。