LLM2D

摘要

arXiv:2409.12883v1 公告类型: 交叉摘要: 在输尿管镜检查过程中实时识别肾结石类型将是泌尿外科领域的一项重大医学进步，因为它可以缩短繁琐的肾结石提取过程的时间，同时降低感染风险。此外，这种自动化程序使得立即开具抗复发治疗成为可能。如今，只有少数经验丰富的泌尿科医生能够在内窥镜检查期间通过屏幕上的视频图像识别肾结石类型。因此，近年来提出了几种深度学习（DL）模型，用于自动识别输尿管镜图像中的肾结石类型。然而，这些DL模型本质上是黑箱，限制了它们在临床环境中的应用。本研究提出了一种基于案例推理的DL模型，该模型使用原型部分（PPs）并生成局部和全局描述符。PPs为每个类别（即肾结石类型）编码视觉特征信息（色调、饱和度、强度和纹理），类似于生物学家所使用的信息。PPs通过在模型训练期间使用的新损失函数进行最佳生成。此外，PPs的局部和全局描述符允许以生物学家和泌尿科医生可理解的方式解释决策（“什么”信息，“图像中的何处”）。所提出的DL模型已在包含六种最常见肾结石类型图像的数据库上进行了测试。总体平均分类准确率为90.37。与肾结石领域其他八种最先进的DL模型相比，可以看出，在解释性方面的显著提升并未以牺牲准确性为代价，甚至相对于文献中最佳方法（88.2）的准确性略有提高。这些有前景且可解释的结果也鼓励泌尿科医生信任基于AI的解决方案。