LLM2D

摘要

arXiv:2311.16176v5 宣告类型: replace-cross 摘要：数据中的虚假相关性，即多个线索能够预测目标标签，常常导致模型依赖于错误的、易于学习的线索，而忽视可靠的线索。在本工作中，我们提出了一种名为DiffDiv的集成多样性框架，利用扩散概率模型（DPMs）来缓解这种类型的偏差。我们展示了在特定的训练时间段内，DPMs可以在训练过程中生成具有新颖特征组合的图像，即使输入特征之间存在相关性。我们利用这一关键属性生成合成的反事实数据，通过集成分歧增加模型的多样性。我们证明，仅通过DPM指导的多样性生成即可消除对捷径线索的依赖，而无需额外的监督信号。我们进一步通过多种多样性目标的实验证实了其有效性，并最终展示了与依赖辅助数据收集的先前工作相当的改进的泛化能力和多样性。