LLM2D
基于自编码器的通用表示学习以用于客户嵌入
Autoencoder-based General Purpose Representation Learning for Customer Embedding
作者: Jan Henrik Bertrand, David B. Hoffmann, Jacopo Pio Gargano, Laurent Mombaerts, Jonathan Taws
发布日期: 2/5/2025
arXiv ID: 2402.18164

摘要

arXiv:2402.18164v2 通知类型: 替换-交叉 摘要: 最近在表示学习方面的进展成功地利用了数据在各个领域的内在领域特定结构。然而,将以表格格式存储的多样且复杂的实体表示在一个潜在空间内仍然是一个挑战。在本文中,我们介绍了 DEEPCAE,这是一种用于多层收缩自编码器(CAE)的正则化项计算的新方法。此外,我们形式化了一个通用实体嵌入框架,并使用该框架实验证明了 DEEPCAE 在重构性能和下游预测性能上均优于所有其他测试的自编码器变体。值得注意的是,在与 13 个数据集上的堆叠 CAE 相比时,DEEPCAE 在重构误差上实现了 34% 的改进。