LLM2D
多模态内容兴趣建模范式 для 用户行为建模
MIM: Multi-modal Content Interest Modeling Paradigm for User Behavior Modeling
作者: Bencheng Yan, Si Chen, Shichang Jia, Jianyu Liu, Yueran Liu, Chenghan Fu, Wanxian Guan, Hui Zhao, Xiang Zhang, Kai Zhang, Wenbo Su, Pengjie Wang, Jian Xu, Bo Zheng, Baolin Liu
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.00321v1

摘要

arXiv:2502.00321v1 类型: cross 摘要: 点击率(CTR)预测是推荐系统、在线搜索和广告平台中的关键任务,准确捕捉用户对内容的真实兴趣对于提升性能至关重要。然而,现有方法严重依赖于ID嵌入,无法反映用户对内容(如图片和标题)的真实偏好。这一局限性在冷启动和长尾场景中尤为明显,传统方法难以提供有效结果。为了解决这些挑战,我们提出了一种新颖的多模态内容兴趣建模范式(MIM),该范式包括三个关键阶段:预训练、内容-兴趣感知监督微调(C-SFT)以及内容-兴趣感知UBM(CiUBM)。预训练阶段将基础模型适应特定领域数据,从而实现高质量多模态嵌入的提取。C-SFT阶段通过利用用户行为信号来弥合内容与用户兴趣之间的语义差距,指导嵌入向用户偏好的对齐。最后,CiUBM阶段将多模态嵌入和基于ID的协同过滤信号整合到一个统一框架中。我们在阿里巴巴旗下的全球最大电商平台之一淘宝上进行了全面的离线实验和在线A/B测试,证明了MIM方法的有效性和效率。该方法已成功部署在线,实现了CTR提升14.14%和RPM提升4.12%,展示了其工业适用性和对平台性能的显著影响。为了促进进一步的研究,我们已在https://pan.quark.cn/s/8fc8ec3e74f3 公开了代码和数据集。