LLM2D

摘要

理解客户意图对于电子商务搜索引擎至关重要。特别是，将正确的产品类型与搜索查询关联起来，对于向客户呈现正确的产品起着至关重要的作用。查询产品类型分类 (Q2PT) 是一项特别具有挑战性的任务，因为搜索查询简短且含糊不清，现有产品类别的数量极其庞大，涵盖数千个值。此外，国际市场面临着额外的挑战，例如语言和方言的多样性以及文化差异，这些都会影响对查询的解释。在这项工作中，我们专注于全球多语言电子商务市场中的 Q2PT 预测。为每个地区分别训练 Q2PT 模型的常用方法在资源匮乏的商店中显示出显著的性能下降。此外，这种方法不允许平滑地扩展到新的国家，需要从头收集数据并训练新的特定地区 Q2PT 模型。为了解决这个问题，我们建议利用从高资源地区到低资源地区的迁移学习，以实现 Q2PT 性能的全球均衡。我们将每个地区的 Q2PT 模型与统一模型进行基准测试，后者在所有全球商店中共享训练数据和模型结构。此外，我们比较了考虑地区因素和不考虑地区因素的 Q2PT 模型，展示了任务对特定国家特征的依赖性。我们对跨 20 个全球地区的超大规模电子商务数据集上的 Q2PT 模型进行了广泛的定量和定性分析，结果表明，统一的考虑地区因素的 Q2PT 模型比其他方法具有更高的性能。