LLM2D
差异中的解缠:通过最大化因素差异直接学习语义解缠表示
Disentanglement in Difference: Directly Learning Semantically Disentangled Representations by Maximizing Inter-Factor Differences
作者: Xingshen Zhang, Shuangrong Liu, Xintao Lu, Chaoran Pang, Lin Wang, Bo Yang
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2502.03123v1

摘要

arXiv:2502.03123v1 类型: cross 摘要: 在这项研究中,提出了差异中的解混杂(DiD)方法,以解决潜在变量的统计独立性和解混杂表示学习中语义解混杂目标之间固有的不一致性。传统的解混杂方法通过提高潜在变量之间的统计独立性来实现解混杂表示。然而,潜在变量的统计独立性并不一定意味着它们在语义上是无关的,因此,提高统计独立性并不总是能够增强解混杂性能。为了解决上述问题,DiD 提出直接学习语义差异,而不是潜在变量的统计独立性。在 DiD 中,设计了一个差异编码器来衡量语义差异;建立了一个对比损失函数以促进跨维度比较。两者都允许模型直接区分和解混杂不同的语义因素,从而解决统计独立性和语义解混杂之间的一致性问题。在 dSprites 和 3DShapes 数据集上的实验结果表明,在各种解混杂指标上,提出的 DiD 显著优于现有主流方法。