LLM2D

摘要

数据中的虚假相关性，即多个线索都能够预测目标标签，通常会导致一种被称为捷径学习的现象，模型依赖于错误的、易于学习的线索，而忽略了可靠的线索。在这项工作中，我们提出了 DiffDiv，这是一个利用扩散概率模型 (DPM) 的集成多样化框架，旨在缓解这种偏差。我们表明，在特定的训练间隔内，DPM 能够生成具有新颖特征组合的图像，即使是在训练样本显示相关输入特征的情况下。我们利用这一关键特性来生成合成反事实，通过集成分歧来提高模型多样性。我们表明，DPM 引导的多样化足以消除对捷径线索的依赖，而无需额外的监督信号。我们进一步从经验上量化了其在几个多样化目标上的有效性，最后展示了与依赖于辅助数据收集的先前工作相当的改进泛化和多样化。