LLM2D

摘要

训练一个多样化的模型集合具有多种实际应用，例如为模型选择提供候选模型，从而获得更好的分布外（OOD）泛化能力，以及利用贝叶斯原理实现 OOD 样本的检测。现有的多样化集成训练方法鼓励模型在提供的 OOD 样本上产生分歧。然而，这种方法计算量大，并且需要良好分离的 ID 和 OOD 示例，因此只在小规模设置中得到验证。 **方法。** 本文提出了一种可扩展集成多样化（SED）方法，该方法适用于大规模设置（例如 ImageNet），并且不需要 OOD 样本。相反，SED 会动态识别训练中的困难样本，并鼓励集成成员对这些样本产生分歧。为了提高可扩展性，我们展示了如何避免现有方法中对模型进行全面成对差异分析的昂贵计算。 **结果。** 我们在 ImageNet 上进行了实验，评估了多样化的益处。首先，对于 OOD 泛化，我们在多种设置中观察到多样化带来的巨大益处，包括输出空间（经典）集成和权重空间集成（模型汤）。其次，对于 OOD 检测，我们将集成假设的多样性转化为一种新颖的不确定性评分估计器，该估计器超过了大量的 OOD 检测基线。代码地址：https://github.com/AlexanderRubinstein/diverse-universe-public.