LLM2D

摘要

arXiv:2504.10538v1 类型: cross 摘要: 基于会话的推荐（SBR）根据匿名会话来预测下一个项目。传统的SBR基于ID合作或辅助内容来探索用户意图。为了进一步缓解数据稀疏性和冷启动问题，最近的多模态SBR（MSBR）方法利用简单的预训练模型进行模态学习，但在语义丰富性方面存在局限性。考虑到大型语言模型（LLM）的语义推理能力，本文集中探讨了LLM增强的MSBR场景，利用LLM的推理能力生成全面的多模态表示，以增强下游的MSBR。解决这个问题面临两个挑战：i) 如何在过渡模式和内在多模态知识上获得LLM的认知，ii) 如何将两者特征统一到一个统一的LLM中，在减少偏差的同时最大化表示的有用性。为此，我们提出了一种多模态增强框架TPAD，该框架扩展了一种蒸馏范式，以解耦和对齐过渡模式，促进MSBR。TPAD建立了并行的知识-LLM和转移-LLM，前者解释项目知识反映的特征，后者在会话下提取过渡感知的特征。利用互信息估计理论的过渡模式对齐模块将两个LLM结合在一起，减少分布偏差，将过渡模式提炼成模态表示。在现实世界数据集上的 extensive 实验证明了我们框架的有效性。