LLM2D

摘要

arXiv:2503.23740v1 映射类型: 交叉摘要：面向任务的对话系统（TODS）经常面临遇到新意图的挑战。新意图发现（NID）是一个关键任务，旨在识别这些新颖的意图，同时保留在现有意图上的识别能力。以前将TODS适应新意图的努力往往面临语义表示不足的问题，或者依赖外部知识，而外部知识往往是不可扩展或不灵活的。最近，大型语言模型（LLMs）展示了强大的零样本能力；然而，它们的规模对于涉及大量查询的实际应用来说可能不切实际。为了通过利用LLMs来解决现有NID方法的局限性，我们提出了一种LANID框架，该框架使用LLMs的指导来增强轻量级NID编码器的语义表示。具体而言，LANID 使用$K$-最近邻和基于密度的空间噪声应用程序聚类（DBSCAN）算法从训练集中采样选择的对话轮次对。然后，它查询LLMs以确定这些轮次对之间的关系。该过程产生的数据被用于设计对比微调任务，然后用于训练一个带有对比三元组损失的小型编码器。我们的实验结果表明，所提出的方法在三个不同的NID数据集中均有效，超越了在无监督和半监督设置中的强大基线。我们的代码可在 https://github.com/floatSDSDS/LANID 获取。