LLM2D

摘要

arXiv:2412.04107v2 宣告类型: replace-cross 摘要：序列推荐（SR）旨在利用用户历史交互中的序列模式准确跟踪其偏好。然而，现有SR方法主要依赖协作数据，这导致了冷启动问题和性能不佳等问题。与此同时，尽管大型语言模型（LLMs）的有效性已经得到了证明，它们的商业推荐系统集成受到了高推理延迟、无法完整捕获所有分布统计以及灾难性遗忘等问题的阻碍。为了解决这些问题，我们提出了一种新颖的预训练、对齐和解纠缠（PAD）框架，以增强SR模型的LLMs能力。具体而言，我们首先分别对SR和LLM模型进行预训练，以获得协作和文本嵌入。随后，我们提出了基于特征推荐的对齐损失，使用高斯核的多核最大均值差异。最后，我们采用了一种频率意识的三专家架构，其中包含对齐和模态特定专家以及解纠缠嵌入。在三个公开数据集上的实验结果验证了PAD的有效性，显示了其显著改进以及与各种SR主干模型的兼容性，特别是在冷物品方面。PAD的代码和数据集可在https://github.com/Applied-Machine-Learning-Lab/PAD获取以供复现。