LLM2D
通用项标记化以实现可迁移生成推荐
Universal Item Tokenization for Transferable Generative Recommendation
作者: Bowen Zheng, Hongyu Lu, Yu Chen, Wayne Xin Zhao, Ji-Rong Wen
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.04405v2

摘要

arXiv:2504.04405v2 宣布类型: 横向替代 摘要:近年来,生成推荐已经逐渐成为一种有前景的范式,吸引了大量研究兴趣。基本框架包括一个项目编码器,它将每个项目表示为一个代码序列,作为其标识符,并且一个生成推荐器,它通过自回归生成目标项目标识符来预测下一个项目。然而,在现有的方法中,编码器和推荐器通常都是特定领域的,限制了它们在新领域的有效转移或适应能力。为此,我们提出了一种通用项目编码approach UTGRec,这是一种为了在多个领域中可以转移的生成推荐而设计的通用项目编码方法。具体来说,我们设计了一个通用项目编码器,通过适应多模态大型语言模型(MLLM)来编码丰富的项目语义。通过设计树状结构的代码本,我们将内容表示离散化为相应的代码以进行项目编码。为了有效地在多个领域中学习通用项目编码器,我们在我们的方法中引入了两个关键方法。对于原始内容的重构,我们使用双重轻量级解码器从离散表示重构项目文本和图像,以捕捉内容中嵌入的一般知识。对于协作知识集成,我们假设同时出现的项目是相似的,并通过共现对齐和重构来整合协作信号。最后,我们提出了一种联合学习框架,以跨多个领域预训练和适应可转移的生成推荐器。在四个公开数据集上的广泛实验表明,UTGRec 在与传统和生成推荐基准相比时表现出优越性。