LLM2D
可解释的基于LLM的多维度蒸馏在电子商务相关性学习中的应用
Explainable LLM-driven Multi-dimensional Distillation for E-Commerce Relevance Learning
作者: Gang Zhao, Ximing Zhang, Chenji Lu, Hui Zhao, Tianshu Wu, Pengjie Wang, Jian Xu, Bo Zheng
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2411.13045v2

摘要

arXiv:2411.13045v2 通知类型: 替换-交叉 摘要:有效的查询-项目相关性建模对于增强电子商务搜索系统的用户体验和保障用户满意度至关重要。近年来,得益于庞大的内在知识,大型语言模型(LLM)方法在性能和长尾泛化能力方面比之前的针对相关性的神经方法表现出色。尽管如此,在实践中,当前的基于LLM的方法仍然存在以下不足:首先,大量参数和计算需求使得其难以在线部署。其次,将LLM模型缩减为在线模型是可行的方向,但LLM的相关性建模是一个黑箱模型,其丰富的内在知识难以提取和在线应用。为提高LLM的可解释性和通过LLM增强在线相关性模型的性能,我们提出了一个解释性LLM驱动的多维度知识蒸馏框架,用于电子商务的相关性学习,该框架包含两个核心组件:(1)一个用于相关性建模的解释性LLM(ELLM-rele),它将相关性学习分解为中间步骤,并将相关性学习建模为一种链式思维(CoT)推理,从而提高LLM的可解释性与性能。(2)一个多维度知识蒸馏(MKD)架构,其从相关性评分分布和CoT推理两个方面,将ELLM-rele的知识转移到当前可部署的交互式和表示式学生模型中。通过蒸馏概率和CoT推理知识,MKD提高了学生模型的语义交互能力和长尾泛化能力。在淘宝搜索广告场景中进行的大量离线评估和在线实验表明,我们提出的框架显著增强了电子商务相关性学习的性能和用户体验。