LLM2D
基于似然的条件深度生成模型分布回归方法
A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models
作者: Shivam Kumar, Yun Yang, Lizhen Lin
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2410.02025v1

摘要

在本研究中,我们探索了条件深度生成模型在分布回归统计框架下的理论性质,其中响应变量位于高维环境空间中,但集中在潜在的低维流形周围。更具体地说,我们研究了基于似然的方法估计这些模型的大样本性质。我们的结果导致了筛最大似然估计器 (MLE) 的收敛速度,用于估计给定预测变量的响应的条件分布(及其演化的对应物)在 Hellinger(Wasserstein)度量中的收敛速度。我们的速率仅取决于真实条件分布的内在维度和光滑度。这些发现从统计基础的角度解释了为什么条件深度生成模型可以规避维数灾难,并证明它们可以学习更广泛的几乎奇异的条件分布。我们的分析还强调了在数据支持足够接近流形时,向数据引入小的噪声扰动的重要性。最后,在我们的数值研究中,我们展示了使用合成数据集和真实世界数据集有效地实施所提出的方法,这也为我们的理论发现提供了补充验证。