摘要
arXiv:2410.02628v2 宣告类型: replace-cross
摘要:学习条件分布 $\pi^*(\cdot|x)$ 是机器学习中的一个核心问题,通常通过带有配对数据 $(x, y) \sim \pi^*$ 的监督方法来解决。然而,获取配对数据样本往往具有挑战性,尤其是在领域转换等问题中。这要求开发出既能利用有限的配对数据,又能利用额外的独立同分布的未配对样本 $x \sim \pi^*_x$ 和 $y \sim \pi^*_y$ 的半监督模型。这种组合数据的使用较为复杂,通常依赖于启发式方法。为了解决这一问题,我们提出了一种新的学习范式,通过数据似然最大化技术无缝地结合了配对数据和未配对数据。我们证明我们的方法还与逆熵最优传输 (OT) 有着有趣的关系。这一发现使得我们能够利用最新的计算 OT 方法建立一种轻量级的学习算法来获取 $\pi^*(\cdot|x)$。此外,我们的方法通过实证测试表明,能够有效利用配对和未配对数据同时学习条件分布。