摘要
arXiv:2505.05683v1 类别: cross
摘要:本研究介绍了一种基于web的交互式健康风险预测工具,旨在使用机器学习模型评估糖尿病风险。基于2015年CDC BRFSS数据集构建,该研究评估了包括逻辑回归、随机森林、XGBoost、LightGBM、KNN和神经网络在内的模型,在原始、SMOTE和欠采样策略下进行评估。LightGBM结合欠采样取得了最佳召回率,使其成为风险检测的理想选择。该工具集成了SHAP和LIME来解释预测,并使用皮尔逊分析突出显示共病的相关性。基于Dash的用户界面使用户能够方便地与模型预测、个性化建议和特征洞察进行交互,支持数据驱动的健康意识。