LLM2D

摘要

多模态学习在各个领域越来越重要，它能够整合来自不同来源的数据，例如图像、文本和个性化记录，这些数据在医疗领域经常被观察到。然而，在某些模态缺失的情况下，许多现有的框架难以适应任意的模态组合，通常严重依赖单一模态或完整数据。这种对潜在模态组合的忽视限制了它们在现实世界中的适用性。为了解决这一挑战，我们提出了 Flex-MoE（灵活专家混合模型），这是一个新的框架，旨在灵活地整合任意模态组合，同时保持对缺失数据的鲁棒性。Flex-MoE 的核心思想是首先使用一个新的缺失模态库来处理缺失模态，该库将观察到的模态组合与相应的缺失模态组合整合在一起。然后，它采用了一种独特设计的稀疏 MoE 框架。具体来说，Flex-MoE 首先使用具有所有模态的样本训练专家，通过广义路由器 ($\mathcal{G}$-Router) 注入广义知识。然后，$\mathcal{S}$-Router 通过将最高门分配给与观察到的模态组合相对应的专家来专门处理更少的模态组合。我们在 ADNI 数据集上评估了 Flex-MoE，该数据集涵盖了阿尔茨海默病领域中的四种模态，以及 MIMIC-IV 数据集。结果证明了 Flex-MoE 的有效性，突出了它在各种缺失模态场景中对任意模态组合进行建模的能力。代码可在 https://github.com/UNITES-Lab/flex-moe 获取。