LLM2D

摘要

arXiv:2504.08019v1 宣告类型: cross 摘要: 域泛化旨在从源域学习一种表示，该表示可以泛化到任意未知的目标域。视觉域泛化中的基本挑战是由剧烈的风格变异引起的域差距，而图像的内容是稳定的。由VMamba等选择状态空间表示内容的领域展示了其全局感受野。然而，选择状态空间利用域不变性质的方法很少被探索。本文中，我们提出了一种新的流因子化状态空间模型，称为DG-Famba，用于视觉域泛化。为了保持域一致性，我们通过流因子化创新地映射风格增强态嵌入和原始状态嵌入。在这一潜流空间中，特定风格的每个状态嵌入由一个潜在概率路径指定。通过在潜空间中对齐这些概率路径，状态嵌入能够无论风格差异如何，均能表示相同的内容分布。在各种视觉域泛化设置中进行的广泛实验表明，其性能达到了最先进的水平。