摘要
arXiv:2504.05309v1 文章类型: cross
摘要:现代电子商务搜索系统的核心在于根据用户的查询匹配用户的意图和可用的选择,提供个性化的精准服务。然而,由于输入模棱两可和拼写错误,用户的查询可能不正确,导致搜索不准确。这些情况可以通过查询重写来解决:将查询修改为其他表示或扩展。然而,传统的查询重写依赖于静态的重写词汇表,该词汇表是手动建立的,同时缺乏与电子商务系统领域的专业知识和现实世界的通用知识的交互。在本文中,利用大规模语言模型(LLMs)生成文本内容的能力,我们提供了一个迭代框架来生成查询重写。该框架在每个迭代中包含三个阶段的过程:通过检索增强生成(RAG)和推理链(CoT)利用领域知识进行重写生成;自动收集正向重写信号更新;以及结合多任务目标对LLM进行后训练以生成新的重写。我们的工作(名为IterQR)提供了一个综合框架来生成具有领域/现实世界知识的查询重写。在每次迭代中,它会自动更新和自我修正重写。该方法已经部署在中国领先的美食配送平台美团单车的搜索系统中,为用户提供显著改进的服务。