LLM2D
LANID: LLM辅助的新意图发现
LANID: LLM-assisted New Intent Discovery
作者: Lu Fan, Jiashu Pu, Rongsheng Zhang, Xiao-Ming Wu
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.23740v1

摘要

arXiv:2503.23740v1 映射类型: 交叉 摘要:面向任务的对话系统(TODS)经常面临遇到新意图的挑战。新意图发现(NID)是一个关键任务,旨在识别这些新颖的意图,同时保留在现有意图上的识别能力。以前将TODS适应新意图的努力往往面临语义表示不足的问题,或者依赖外部知识,而外部知识往往是不可扩展或不灵活的。最近,大型语言模型(LLMs)展示了强大的零样本能力;然而,它们的规模对于涉及大量查询的实际应用来说可能不切实际。为了通过利用LLMs来解决现有NID方法的局限性,我们提出了一种LANID框架,该框架使用LLMs的指导来增强轻量级NID编码器的语义表示。具体而言,LANID 使用$K$-最近邻和基于密度的空间噪声应用程序聚类(DBSCAN)算法从训练集中采样选择的对话轮次对。然后,它查询LLMs以确定这些轮次对之间的关系。该过程产生的数据被用于设计对比微调任务,然后用于训练一个带有对比三元组损失的小型编码器。我们的实验结果表明,所提出的方法在三个不同的NID数据集中均有效,超越了在无监督和半监督设置中的强大基线。我们的代码可在 https://github.com/floatSDSDS/LANID 获取。