LLM2D
DGFamba: 学习流因子化的状态空间进行视觉域泛化
DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization
作者: Qi Bi, Jingjun Yi, Hao Zheng, Haolan Zhan, Wei Ji, Yawen Huang, Yuexiang Li
发布日期: 4/14/2025
arXiv ID: oai:arXiv.org:2504.08019v1

摘要

arXiv:2504.08019v1 宣告类型: cross 摘要: 域泛化旨在从源域学习一种表示,该表示可以泛化到任意未知的目标域。视觉域泛化中的基本挑战是由剧烈的风格变异引起的域差距,而图像的内容是稳定的。由VMamba等选择状态空间表示内容的领域展示了其全局感受野。然而,选择状态空间利用域不变性质的方法很少被探索。本文中,我们提出了一种新的流因子化状态空间模型,称为DG-Famba,用于视觉域泛化。为了保持域一致性,我们通过流因子化创新地映射风格增强态嵌入和原始状态嵌入。在这一潜流空间中,特定风格的每个状态嵌入由一个潜在概率路径指定。通过在潜空间中对齐这些概率路径,状态嵌入能够无论风格差异如何,均能表示相同的内容分布。在各种视觉域泛化设置中进行的广泛实验表明,其性能达到了最先进的水平。