LLM2D
基于卡尔曼滤波的线性可变形扩散模型在视网膜图像分割中的应用
KLDD: Kalman Filter based Linear Deformable Diffusion Model in Retinal Image Segmentation
作者: Zhihao Zhao, Yinzheng Zhao, Junjie Yang, Kai Huang, Nassir Navab, M. Ali Nasseri
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2410.02808v1

摘要

基于人工智能的血管分割在增强眼科疾病的筛查和治疗中越来越普遍。基于 U-Net 的深度学习结构在血管分割方面取得了相对较好的性能。然而,在通过传统的 U-Net 降采样模块时,细小的血管和毛细血管往往会丢失。为了解决这一差距,本文提出了一种新颖的基于卡尔曼滤波的线性可变形扩散 (KLDD) 模型用于视网膜血管分割。我们的模型采用了一种扩散过程,通过迭代地细化分割,利用可变形卷积在特征提取模块中的灵活感受野来适应详细的管状血管结构。更具体地说,我们首先使用具有线性可变形卷积的特征提取器从输入图像中捕获血管结构信息。为了更好地优化可变形卷积的坐标位置,我们采用卡尔曼滤波器来增强线性可变形卷积中对血管结构的感知。随后,提取的血管结构特征被交叉注意力聚合模块 (CAAM) 和通道级软注意力模块 (CSAM) 作为扩散模型中的条件元素。这些聚合旨在增强扩散模型生成血管结构的能力。实验在视网膜眼底图像数据集(DRIVE、CHASE_DB1)以及 OCTA-500 数据集的 3mm 和 6mm 上进行评估,结果表明本文提出的扩散模型优于其他方法。