LLM2D

摘要

在医疗领域，大规模数据集的有限可用性和劳动密集型的标注过程阻碍了深度模型的性能。基于扩散的生成式增强方法为解决这一问题提供了一种有前景的解决方案，已被证明在推进下游医疗识别任务方面有效。然而，现有的工作缺乏足够的语义和顺序可控性，难以进行具有挑战性的视频/3D 序列生成，并且忽略了对噪声合成样本的质量控制，导致合成数据库不可靠，严重限制了下游任务的性能。在这项工作中，我们提出了 Ctrl-GenAug，这是一种新颖且通用的生成式增强框架，它能够实现高度语义和顺序定制的序列合成，并抑制错误合成的样本，以帮助医疗序列分类。具体来说，我们首先设计了一个多模态条件引导序列生成器，用于可控地合成促进诊断的样本。集成了一个顺序增强模块来增强生成样本的时间/立体 coherence。然后，我们提出了一种噪声合成数据过滤器，以在语义和顺序层面上抑制不可靠的案例。在 3 个医疗数据集上进行了大量的实验，使用在 3 种范式上训练的 11 个网络，全面分析了 Ctrl-GenAug 的有效性和通用性，特别是在代表性不足的高风险人群和域外条件下。