LLM2D

摘要

arXiv:2409.17091v2 宣布类型: replace-cross 摘要: 在医疗领域，可用的大规模数据集有限以及耗时的标注过程限制了深度模型的性能。基于扩散的生成增强方法为解决这一问题提供了一个有前景的解决方案，已在促进下游医疗识别任务方面证明了其有效性。然而，现有工作在具有挑战性的视频/3D 序列生成方面缺乏足够的语义和序列操控性，并且忽略了对合成样本质量的控制，导致不可靠的合成数据库，并严重影响了下游任务的性能。在本文中，我们提出了一种名为 Ctrl-GenAug 的新颖且通用的生成增强框架，该框架能够实现高度语义和序列定制化的序列合成，并抑制错误合成的样本，以辅助医疗序列分类。具体而言，我们首先设计了一个多模态条件引导序列生成器以可控地合成诊断促进型样本。集成了一个序列增强模块以增强生成样本的时间/立体一致性。然后，我们提出了一种噪声合成数据过滤器，用于在语义和序列层面抑制不可靠的情况。我们使用3个医疗数据集中的11个在3种范式下训练的网络进行了广泛的实验，全面分析了Ctrl-GenAug的有效性和通用性，特别是在未被充分代表的高风险群体和跨域条件下。