LLM2D
通用项目标记化以实现可转移的生成性推荐
Universal Item Tokenization for Transferable Generative Recommendation
作者: Bowen Zheng, Hongyu Lu, Yu Chen, Wayne Xin Zhao, Ji-Rong Wen
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.04405v1

摘要

arXiv:2504.04405v1 传播类型: 交叉 摘要: 最近,生成推荐作为一种有前途的范式已经引起了显著的研究关注。基本框架包括一项项目分词器,它将每个项目表示为标识符代码序列以充当其标识符,并且一个生成推荐器,通过自回归生成目标项目标识符来预测下一个项目。但是,在现有的方法中,分词器和推荐器通常都是特定于领域的,这限制了它们在新领域的有效转移或适应能力。为了解决这个问题,我们提出了一种通用项目分词方法UTGRec,用于转移生成推荐。具体而言,我们设计了一种通用项目分词器,通过适应多模态大语言模型(MLLM)来编码丰富的项目语义。通过设计树状结构的码本,我们将内容表示离散化为相应的代码以进行项目分词。为了在多个领域有效学习通用项目分词器,我们在方法中引入了两种关键技术。对于原始内容重构,我们使用双重轻量级解码器从离散表示中重构项目文本和图像,以捕获内容嵌入的一般知识。对于协作知识集合法,我们假设共现项目相似,并通过共现对齐和重构来集成协作信号。最后,我们提出了一种联合学习框架,用于在多个领域预训练和适配转移生成推荐器。在四个公开数据集上的广泛实验表明,UTGRec 在与传统和生成推荐基线的比较中具有优越性。