LLM2D
差异中的解耦:通过最大化因子差异直接学习语义解耦表示
Disentanglement in Difference: Directly Learning Semantically Disentangled Representations by Maximizing Inter-Factor Differences
作者: Xingshen Zhang, Lin Wang, Shuangrong Liu, Xintao Lu, Chaoran Pang, Bo Yang
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2502.03123v2

摘要

arXiv:2502.03123v2 Announce Type: replace-cross 摘要:在本研究中,提出了差异去耦(DiD)方法,以解决潜在变量统计独立试验与语义去耦目标之间固有的不一致性问题,该问题出现在去耦表示学习中。传统去耦方法通过提高潜在变量之间的统计独立性来实现去耦表示。然而,潜在变量之间的统计独立性并不一定意味着它们在语义上是无关的,因此,提高统计独立性并不总是能够提升去耦性能。为了解决上述问题,DiD 提出直接学习语义差异,而不是潜在变量的统计独立性。在 DiD 中,设计了一个差异编码器来度量语义差异;建立了一个对比损失函数以促进跨维度的比较。两者都使得模型能够直接区分和去耦不同的语义因素,从而解决了统计独立性和语义去耦之间的不一致性。在 dSprites 和 3DShapes 数据集上的实验结果表明,提出的 DiD 在各种去耦评价指标上均优于现有的主流方法。