LLM2D

摘要

arXiv:2502.12948v1 Announce Type: cross Abstract: 从心脏LGE MRI图像中检测超增强是一个需要大量临床专业知识的任务。尽管基于深度学习的模型在该任务上显示出有希望的结果，但它们需要大量具有精细注释的数据。为心脏MR研究生成的临床报告中包含丰富的临床相关信息，包括任何瘢痕的部位、范围和病因。尽管最近开发的基于CLIP的方法能够使用图像-文本对进行预训练，但它也要求大量数据和进一步的微调策略。在本研究中，我们利用源于领域知识的各种策略，仅使用临床报告中的文本对965名患者的相对较小的临床队列进行LGE检测模型的训练。我们通过合成数据增强来提高性能，系统地创建了瘢痕图像及其相关文本。此外，我们以解剖学为基础标准化图像的方向，以促进空间和文本特征的更好对齐。我们还使用描述性损失使细粒度监督成为可能，并探索视觉编码器预训练对性能的影响。最后，我们进行了消融研究，以阐明每个设计组件对模型整体性能的贡献。