摘要
准确的黄斑定位对于分析视网膜疾病以预防不可逆的视力丧失至关重要。虽然当前基于深度学习的方法优于传统方法,但它们仍然面临着一些挑战,例如黄斑周围缺乏局部解剖学标志,无法鲁棒地处理患病视网膜图像以及图像条件的变化。在本文中,我们提出了一种新颖的基于Transformer的架构,称为双流黄斑网络(DSFN),用于多线索融合。该架构通过使用视网膜和血管分布显式地整合了远程连接和全局特征,以实现鲁棒的黄斑定位。我们在双流编码器中引入了空间注意力机制,以提取和融合自学习的解剖信息,更多地关注沿血管分布的特征,并通过减少标记数量来显著降低计算成本。我们广泛的实验表明,所提出的架构在两个公共数据集和一个大型私有数据集上实现了最先进的性能。此外,我们证明了DSFN在正常和患病视网膜图像上都更加鲁棒,并且在跨数据集实验中具有更好的泛化能力。