LLM2D

摘要

arXiv:2505.05683v1 类别: cross 摘要：本研究介绍了一种基于web的交互式健康风险预测工具，旨在使用机器学习模型评估糖尿病风险。基于2015年CDC BRFSS数据集构建，该研究评估了包括逻辑回归、随机森林、XGBoost、LightGBM、KNN和神经网络在内的模型，在原始、SMOTE和欠采样策略下进行评估。LightGBM结合欠采样取得了最佳召回率，使其成为风险检测的理想选择。该工具集成了SHAP和LIME来解释预测，并使用皮尔逊分析突出显示共病的相关性。基于Dash的用户界面使用户能够方便地与模型预测、个性化建议和特征洞察进行交互，支持数据驱动的健康意识。