LLM2D
预训练、对齐和解耦:大型语言模型赋能序列推荐
Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models
作者: Yuhao Wang, Junwei Pan, Pengyue Jia, Wanyu Wang, Maolin Wang, Zhixiang Feng, Xiaotian Li, Jie Jiang, Xiangyu Zhao
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2412.04107v2

摘要

arXiv:2412.04107v2 宣告类型: replace-cross 摘要:序列推荐(SR)旨在利用用户历史交互中的序列模式准确跟踪其偏好。然而,现有SR方法主要依赖协作数据,这导致了冷启动问题和性能不佳等问题。与此同时,尽管大型语言模型(LLMs)的有效性已经得到了证明,它们的商业推荐系统集成受到了高推理延迟、无法完整捕获所有分布统计以及灾难性遗忘等问题的阻碍。为了解决这些问题,我们提出了一种新颖的预训练、对齐和解纠缠(PAD)框架,以增强SR模型的LLMs能力。具体而言,我们首先分别对SR和LLM模型进行预训练,以获得协作和文本嵌入。随后,我们提出了基于特征推荐的对齐损失,使用高斯核的多核最大均值差异。最后,我们采用了一种频率意识的三专家架构,其中包含对齐和模态特定专家以及解纠缠嵌入。在三个公开数据集上的实验结果验证了PAD的有效性,显示了其显著改进以及与各种SR主干模型的兼容性,特别是在冷物品方面。PAD的代码和数据集可在https://github.com/Applied-Machine-Learning-Lab/PAD获取以供复现。