摘要
arXiv:2502.13881v3 宣布类型: replace-cross
摘要:对话型产品搜索(CPS)系统通过自然语言与用户交互,提供个性化和上下文相关的商品列表。然而,现有大多数关于CPS的研究仅限于模拟对话,因为缺乏由类似人类语言驱动的真实CPS数据集。此外,现有的电商对话数据集是为特定市场或特定语言构建的,因此无法支持跨市场和多语言使用。在本文中,我们提出了一个CPS数据收集协议,并创建了一个新的CPS数据集PSCon,该数据集通过类似人类语言的对话来协助产品搜索。该数据集通过指导下的human-human数据收集协议收集,适用于两个市场和两种语言。通过制定CPS任务,数据集允许对六个子任务进行全面和深入的研究:用户意图检测、关键词提取、系统行为预测、问题选择、项目排名和响应生成。此外,我们对数据集进行了简要分析,并在提出的CPS数据集上提出了基准模型。我们提出的数据集和模型将有助于促进未来CPS的研究。