LLM2D
从电商网站结构中学习变体产品关系和变体属性
Learning variant product relationship and variation attributes from e-commerce website structures
作者: Pedro Herrero-Vidal, You-Lin Chen, Cris Liu, Prithviraj Sen, Lichao Wang
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2410.02779v1

摘要

我们引入了 VARM,即变体关系匹配策略,用于识别电子商务目录中的变体产品对。传统的实体解析定义关注的是产品提及是否指向同一个底层产品。然而,这无法捕捉到对电子商务应用至关重要的产品关系,例如在同一网页上列出类似但并不完全相同的产品,或共享评论。在这里,我们制定了一种新的实体解析类型,即变体产品关系,以捕捉这些类似的电子商务产品链接。与传统定义不同,新定义要求既要识别两个产品是否彼此匹配,又要识别它们之间哪些属性存在差异。为了满足这两个要求,我们开发了一种策略,它利用了编码和生成式 AI 模型的优势。首先,我们构建了一个数据集,该数据集捕捉网页产品链接,因此捕捉变体产品关系,以训练一个编码 LLM 来预测任何给定产品对的变体匹配。其次,我们使用 RAG 提示的生成式 LLM 来提取变体产品组之间的变异和共同属性。为了验证我们的策略,我们使用来自全球领先电子商务零售商之一的真实数据评估了模型性能。结果表明,我们的策略优于替代解决方案,并为利用这些新型产品关系铺平了道路。