LLM2D

摘要

arXiv:2412.13573v2 公告类型：替换交叉摘要：域泛化旨在从多个训练域学习一个模型，并将其应用于未见过的测试域。最近的理论已经表明，寻求那些参数位于损失景观平坦极小值中的深层模型可以显著减少域外泛化误差。然而，现有的方法往往忽视不同域中损失景观的连贯性，导致模型无法同时在所有域中位于最佳平坦极小值中，从而限制了其泛化能力。为了解决这一问题，本文提出了一种迭代的自我反馈训练（SFT）框架，通过在训练过程中逐步细化损失景观，寻求在不同域中共享的一致平坦极小值。它通过测量不同域中损失景观的一致性来生成反馈信号，并利用该反馈信号以更高的一致性细化这些损失景观。得益于这些细化后的损失景观中平坦极小值的一致性，我们的SFT有助于实现更好的域外泛化。实验结果表明，DomainBed上的SFT在与最先进的尖锐感知方法和其他流行的域泛化基线相比时，表现更优。在五个域泛化基准中的平均表现上，SFT分别使用ResNet-50和ViT-B/16时，优于尖锐感知最小化2.6%和1.5%。代码将很快发布。