摘要
arXiv:2503.04830v3 陈述类型: replace-cross
摘要:随着对话型大型语言模型(LLMs)的发展,已经开发出了多种基于LLM的对话型购物代理(CSA),以帮助客户顺利进行在线购物。在构建一个充满吸引力且可信赖的CSA时,主要目标是确保代理关于产品事实信息的回答准确且基于事实。然而,仍存在两个挑战。首先,LLMs会产生虚构的或未支持的断言。这些不准确的信息会增加传播误导性信息的风险,并降低客户信任。其次,在CSA的回答中不提供知识来源的引用,客户难以验证LLM生成的信息。为了解决这两个挑战,我们提出了一种易于生产化的解决方案,使我们的客户能够体验引用。我们构建了自动评估指标,以全面评估LLM的接地能力和引用能力,表明通过引用生成范式,接地性能提高了13.83%。为在大规模部署此功能,我们引入了多UX推理系统,该系统在保持现有用户体验功能的同时,支持大规模推理,并在输出中附加来源引用。大规模在线A/B测试显示,基于事实的CSA回答在不同的用户体验变体下可提高客户参与度3% - 10%。