摘要
arXiv:2504.10538v1 类型: cross
摘要: 基于会话的推荐(SBR)根据匿名会话来预测下一个项目。传统的SBR基于ID合作或辅助内容来探索用户意图。为了进一步缓解数据稀疏性和冷启动问题,最近的多模态SBR(MSBR)方法利用简单的预训练模型进行模态学习,但在语义丰富性方面存在局限性。考虑到大型语言模型(LLM)的语义推理能力,本文集中探讨了LLM增强的MSBR场景,利用LLM的推理能力生成全面的多模态表示,以增强下游的MSBR。解决这个问题面临两个挑战:i) 如何在过渡模式和内在多模态知识上获得LLM的认知,ii) 如何将两者特征统一到一个统一的LLM中,在减少偏差的同时最大化表示的有用性。为此,我们提出了一种多模态增强框架TPAD,该框架扩展了一种蒸馏范式,以解耦和对齐过渡模式,促进MSBR。TPAD建立了并行的知识-LLM和转移-LLM,前者解释项目知识反映的特征,后者在会话下提取过渡感知的特征。利用互信息估计理论的过渡模式对齐模块将两个LLM结合在一起,减少分布偏差,将过渡模式提炼成模态表示。在现实世界数据集上的 extensive 实验证明了我们框架的有效性。