LLM2D

摘要

arXiv:2503.04830v3 陈述类型: replace-cross 摘要：随着对话型大型语言模型（LLMs）的发展，已经开发出了多种基于LLM的对话型购物代理（CSA），以帮助客户顺利进行在线购物。在构建一个充满吸引力且可信赖的CSA时，主要目标是确保代理关于产品事实信息的回答准确且基于事实。然而，仍存在两个挑战。首先，LLMs会产生虚构的或未支持的断言。这些不准确的信息会增加传播误导性信息的风险，并降低客户信任。其次，在CSA的回答中不提供知识来源的引用，客户难以验证LLM生成的信息。为了解决这两个挑战，我们提出了一种易于生产化的解决方案，使我们的客户能够体验引用。我们构建了自动评估指标，以全面评估LLM的接地能力和引用能力，表明通过引用生成范式，接地性能提高了13.83%。为在大规模部署此功能，我们引入了多UX推理系统，该系统在保持现有用户体验功能的同时，支持大规模推理，并在输出中附加来源引用。大规模在线A/B测试显示，基于事实的CSA回答在不同的用户体验变体下可提高客户参与度3% - 10%。