摘要
arXiv:2502.11596v1 类型: cross
摘要:表格式深度学习方法在处理输入之前需将数值和类别特征嵌入到高维空间中。现有方法通过采用特定类型编码方法来应对表数据的异质性,这限制了跨表数据的转移潜力以及利用预训练知识的能力。我们提出了一种新颖的方法,首先将表数据转换为文本,然后利用预训练的大语言模型表示来编码数据,从而提供了一种即插即用的方案以改进表数据的深度学习方法。我们通过在七个分类数据集上的验证展示了我们的方法在准确率上优于竞争模型,如MLP、ResNet和FT-Transformer。