LLM2D

摘要

arXiv:2502.03505v1 宣传类型: cross 摘要：本研究提出了一种基于运动的学习网络（MoGLo-Net），结合全局-局部自注意力模块，以提高手持光声和超声成像（PAUS）中的三维重建性能。标准的PAUS成像经常受限于狭隘的视场和有效可视化复杂三维结构的能力不足。自由手三维技术通过将连续的二维图像对齐来实现三维重建，但在不依赖外部位置传感器的情况下进行精确运动估计存在重大挑战。MoGLo-Net通过创新地适应自注意力机制来应对这些限制，有效地利用连续超声图像中的关键区域，如完全发育的斑点区域或高回声组织区域来准确估计运动参数。这有助于从各个帧中提取复杂特征。此外，我们设计了一种块间相关操作来生成高度与扫描运动相关联的相关体。还开发了一个自定义损失函数，以利用运动参数的特性确保稳健学习并最小化偏差。实验评估表明，MoGLo-Net在定性和定量性能指标上均超越了当前最先进的方法。此外，我们还扩展了三维重建技术的应用，不仅限于简单的B模式超声体积，还包括多普勒超声和光声成像，从而实现血管的三维可视化。本研究的源代码在以下地址公开获取：https://github.com/guhong3648/US3D