LLM2D
使用视觉变换器自动诊断肺部疾病:胸部X光分类的对比研究
Automated diagnosis of lung diseases using vision transformer: a comparative study on chest x-ray classification
作者: Muhammad Ahmad, Sardar Usman, Ildar Batyrshin, Muhammad Muzammil, K. Sajid, M. Hasnain, Muhammad Jalal, Grigori Sidorov
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2503.18973v1

摘要

arXiv:2503.18973v1 类别:交叉领域 摘要:背景:肺部疾病是一个重要的健康问题,特别是在儿童和老年人中更为显著。这些疾病通常由肺部感染引起,并且是儿童死亡的主要原因。全球范围内,与肺部相关的疾病每年夺去许多生命,因此早期和准确的诊断至关重要。X射线是诊断这类疾病的重要工具。最常见的肺部疾病,包括肺炎、哮喘、过敏、慢性阻塞性肺疾病(COPD)、支气管炎、肺气肿和肺癌,构成了重大的公共卫生挑战。早期预测这些疾病是关键的,因为它有助于识别风险因素并采取预防措施,以降低疾病发生的可能性。 方法:在这个研究中,我们使用了一个包含3,475张胸部X光图像的数据集,这些图像来源于Talukder, M. A. (2023) [14]通过Mendeley Data提供的数据,并将这些图像分为三个类别:正常、肺部阴影和肺炎。我们应用了五种预训练的深度学习模型,包括CNN、ResNet50、DenseNet、CheXNet、U-Net以及两种迁移学习算法,分别为Vision Transformer (ViT) 和Shifted Window (Swin),来分类这些图像。这一方法旨在通过减少对人力干预的依赖,利用自动化分类系统解决肺部异常的诊断问题。我们的分析在二分类和多分类两种设置下进行。结果:在二分类中,我们专注于区分正常和病毒性肺炎病例,而在多分类中,所有三个类别(正常、肺部阴影和病毒性肺炎)都被包括在内。我们提出的方法(ViT)取得了显著的性能,二分类的准确率为99%,而多分类的准确率为95.25%。