LLM2D

摘要

对话状态跟踪（DST）对于理解用户需求并在面向任务的对话中执行适当的系统操作至关重要。大多数现有的 DST 方法被设计为在预定义的本体内工作，并假设存在黄金域标签，因此难以适应新的槽值。虽然基于大型语言模型 (LLM) 的系统展现出有希望的零样本 DST 性能，但它们要么需要大量的计算资源，要么性能不如现有的完全训练的系统，限制了它们的实用性。为了解决这些限制，我们提出了一种零样本、开放词汇的系统，它将域分类和 DST 集成到一个管道中。我们的方法包括将 DST 重构为一个问答任务，以适用于能力较弱的模型，并为更具适应性的模型采用自我完善的提示。我们的系统不依赖于本体中定义的固定槽值，从而使系统能够动态地适应。我们将我们的方法与现有的最先进方法进行了比较，结果表明，它在 Multi-WOZ 2.1 等数据集上比以前的方法提供了高达 20% 的联合目标准确率 (JGA) 提升，同时将对 LLM API 的请求减少了高达 90%。