LLM2D
通过双曲状态空间幻视学习细粒度领域泛化
Learning Fine-grained Domain Generalization via Hyperbolic State Space Hallucination
作者: Qi Bi, Jingjun Yi, Haolan Zhan, Wei Ji, Gui-Song Xia
发布日期: 4/14/2025
arXiv ID: oai:arXiv.org:2504.08020v1

摘要

arXiv:2504.08020v1 域泛化类型:跨域 摘要:细粒度域泛化(FGDG)的目标是在仅使用源域数据进行训练的情况下,学习一种能够很好地泛化到未见过的目标域的细粒度表示。与通用域泛化相比,FGDG尤其具有挑战性,因为细粒度类别只能通过一些细微且微小的模式来区分。这些模式在由于光照、颜色等因素引起的跨域样式转变下尤其脆弱。为了推进这一前沿,本文提出了一种新颖的双曲状态空间 hallucination(HSSH)方法。该方法由两个关键组件组成,即状态空间 hallucination (SSH) 和 双曲流形一致性 (HMC)。SSH 通过首先外推然后 hallucination 源图像来丰富状态嵌入的样式多样性。然后,预处理和后处理的样式 hallucination 状态嵌入被投影到双曲流形上。双曲状态空间建模高阶统计特性,并能更好地区分细粒度模式。最后,通过最小化双曲距离,从而消除样式变化对细粒度模式的影响。在三个 FGDG 基准上的实验展示了其最先进的性能。