LLM2D

摘要

目的：随着现实世界数据库的指数级增长，处理异构和混合数据类型变得越来越重要。虽然深度生成模型试图将不同的数据视图合并到一个共同的潜在空间中，但它们往往牺牲了可解释性、灵活性和模块化。本研究提出了一种新方法，通过将变分自动编码器 (VAE) 与因子分析潜在空间 (FA-VAE) 相结合来解决这些限制。方法：提出的 FA-VAE 方法采用多个 VAE 来学习连续潜在空间中每个异构数据视图的私有表示。使用通过线性投影矩阵生成的低维潜在空间在视图之间共享信息。这种模块化设计在私有和共享潜在空间之间创建了分层依赖关系，允许灵活添加新视图和调节预训练模型。结果：FA-VAE 方法促进了不同领域的数据交叉生成，并实现了生成模型之间的迁移学习。这允许有效地整合来自不同数据视图的信息，同时保留其独特的特征。结论：通过克服现有方法的局限性，FA-VAE 为管理异构数据类型提供了一种更可解释、更灵活和更模块化的解决方案。它为更有效和可扩展的数据处理策略提供了一条途径，增强了跨域数据合成和模型可转移性的潜力。