摘要
理解客户意图对于电子商务搜索引擎至关重要。特别是,将正确的产品类型与搜索查询关联起来,对于向客户呈现正确的产品起着至关重要的作用。查询产品类型分类 (Q2PT) 是一项特别具有挑战性的任务,因为搜索查询简短且含糊不清,现有产品类别的数量极其庞大,涵盖数千个值。此外,国际市场面临着额外的挑战,例如语言和方言的多样性以及文化差异,这些都会影响对查询的解释。在这项工作中,我们专注于全球多语言电子商务市场中的 Q2PT 预测。为每个地区分别训练 Q2PT 模型的常用方法在资源匮乏的商店中显示出显著的性能下降。此外,这种方法不允许平滑地扩展到新的国家,需要从头收集数据并训练新的特定地区 Q2PT 模型。为了解决这个问题,我们建议利用从高资源地区到低资源地区的迁移学习,以实现 Q2PT 性能的全球均衡。我们将每个地区的 Q2PT 模型与统一模型进行基准测试,后者在所有全球商店中共享训练数据和模型结构。此外,我们比较了考虑地区因素和不考虑地区因素的 Q2PT 模型,展示了任务对特定国家特征的依赖性。我们对跨 20 个全球地区的超大规模电子商务数据集上的 Q2PT 模型进行了广泛的定量和定性分析,结果表明,统一的考虑地区因素的 Q2PT 模型比其他方法具有更高的性能。