LLM2D
利用基因表达数据和可解释机器学习增强2型糖尿病的早期检测
Leveraging Gene Expression Data and Explainable Machine Learning for Enhanced Early Detection of Type 2 Diabetes
作者: Aurora Lithe Roy, Md Kamrul Siam, Nuzhat Noor Islam Prova, Sumaiya Jahan, Abdullah Al Maruf
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14471v1

摘要

糖尿病,特别是2型糖尿病(T2D),构成了巨大的全球健康负担,其相关的并发症,如心血管疾病、肾衰竭和视力障碍,进一步加剧了这一负担。T2D的早期检测对于改善医疗保健结果和优化资源分配至关重要。在本研究中,我们利用机器学习(ML)技术对来自T2D患者的基因表达数据进行分析,以解决T2D早期检测方面的不足。我们的主要目标是通过先进的ML方法提高T2D早期检测的准确性,并使用可解释人工智能(XAI)技术提高模型的可信度。通过基因表达数据集分析T2D的潜在生物学机制代表了一个新的研究前沿,在以往的研究中相对较少被探索。虽然许多研究都集中于利用临床和人口统计数据进行T2D预测,但整合来自基因表达数据集的分子信息为理解该疾病的病理生理学提供了一条独特而有前景的途径。通过对来自NCBI基因表达综合数据库(GEO)的数据应用六种ML分类器,我们观察到所有模型均表现出良好的性能。值得注意的是,XGBoost分类器的准确率最高,达到97%。我们的研究解决了T2D早期检测方法中的一个显著差距,强调了利用基因表达数据和先进ML技术的重要性。