LLM2D

摘要

arXiv:2504.18961v1 宣布类型: cross 摘要：随着多模态大规模语言模型(MLLMs)的快速发展，越来越多的研究人员正在探索其在推荐系统中的应用。然而，大型模型的高延迟为这些用例带来了重大挑战。EReL@MIR研讨会为实验改进多模态表示学习以提高信息检索任务效率的各种方法提供了宝贵的机会。作为比赛的要求之一，参赛者被要求提交一份技术报告，详细说明他们的方法和发现。我们团队荣幸地获得了Task 2 - 优胜者（多模态点击率预测）的奖项。在这份技术报告中，我们介绍了我们的方法和关键发现。此外，我们还提出了几个未来工作的方向，特别关注如何有效地将推荐信号集成到多模态表示中。我们的实现代码库已公开发布在：https://github.com/Lattice-zjj/MMCTR_Code，训练好的模型权重可在此访问：https://huggingface.co/FireFlyCourageous/MMCTR_DIN_MicroLens_1M_x1。