LLM2D

摘要

Mamba，作为状态空间模型的一种特殊情况，正逐渐成为医学图像分析中基于模板的深度学习方法的替代方案。尽管Transformer是一种强大的架构，但它也存在一些缺点，包括二次计算复杂度以及无法有效地处理长距离依赖关系。这种限制影响了医学影像中对大型复杂数据集的分析，因为这些数据集中存在许多空间和时间关系。相比之下，Mamba 的优势使其非常适合医学图像分析。它具有线性时间复杂度，比 Transformer 有显著的改进。Mamba 在没有注意力机制的情况下处理更长的序列，从而实现更快的推理，并需要更少的内存。Mamba 还展示了在合并多模态数据方面的强大性能，从而提高了诊断准确性和患者预后。本文的组织方式使读者能够逐步了解 Mamba 在医学影像中的能力。我们首先定义了 SSM 和模型的核心概念，包括 S4、S5 和 S6，然后探索了 Mamba 架构，例如纯 Mamba、U-Net 变体以及与卷积神经网络、Transformer 和图神经网络的混合模型。我们还涵盖了 Mamba 优化、技术和适应、扫描、数据集、应用、实验结果，最后总结了其在医学影像中的挑战和未来方向。这篇综述旨在展示 Mamba 在克服医学影像中现有障碍方面的变革潜力，同时为该领域的创新进步铺平道路。本文中回顾的应用于医学领域的 Mamba 架构的完整列表可在 Github 上找到。