摘要
arXiv:2502.07090v1 公告类型: cross
摘要: 准确地预测集成了表格、文本和视觉输入或输出的多模态数据对于在各种应用领域推进分析至关重要。传统方法往往难以在保持高预测准确性的同时整合异构数据类型。我们提出了生成分布预测(GDP),这是一种新颖的框架,利用条件扩散模型等多模态合成数据生成方法来提高结构化和非结构化模态的预测性能。GDP 是模型无关的,可以与任何高保真生成模型兼容,并支持领域适应的迁移学习。我们为 GDP 建立了严格的理论基础,提供了当使用扩散模型作为生成核心时对其预测准确性进行统计保证。通过估计数据生成分布并适应各种损失函数以最小化风险,GDP 能够在多模态设置中实现准确的点预测。我们通过四个监督学习任务(表格数据预测、问答、图像字幕生成和自适应分位数回归) empirical 验证了 GDP,展示了其在不同领域的多样性和有效性。