LLM2D
基于小波的全局-局部交互网络结合跨注意力机制用于多视图糖尿病视网膜病变检测
Wavelet-based Global-Local Interaction Network with Cross-Attention for Multi-View Diabetic Retinopathy Detection
作者: Yongting Hu, Yuxin Lin, Chengliang Liu, Xiaoling Luo, Xiaoyan Dou, Qihao Xu, Yong Xu
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2503.19329v1

摘要

arXiv:2503.19329v1 交叉类型:cross 摘要:多视角糖尿病视网膜病变(DR)检测最近被认为是有希望的方法,用于解决单视角DR中存在的不完整病灶问题。然而,由于病灶的大小和位置变化多样且分散,这一问题仍然颇具挑战性。此外,现有的多视角DR方法通常会合并多个视角的信息,而不考虑这些视角之间病灶信息的相关性和冗余性。因此,我们提出了一种新颖的方法,以克服难以学习的病灶信息和不充分的多视角融合的挑战。具体来说,我们引入了一个两分支网络,以获得局部病灶特征及其全局依赖关系。小波变换的高频分量被用来利用病灶边缘信息,然后通过全局语义进行增强,以促进难以学习的病灶的学习。此外,我们提出了一种跨视角融合模块,以提高多视角融合的效果并减少冗余。在大规模公开数据集上的实验结果表明了我们方法的有效性。代码已在https://github.com/HuYongting/WGLIN 开源。