LLM2D

摘要

在面向任务的对话系统领域，一个强大的意图检测机制必须能够有效处理现实场景中遇到的格式错误的话语。本研究提出了一种针对大型语言模型（LLMs）的新型微调框架，旨在增强分布内（ID）意图分类和分布外（OOD）意图检测，该框架利用从ID类名派生的原型进行语义匹配。通过利用LLMs的高度可区分表示，我们采用基于多样性的提示微调方法为每个ID类构建语义原型。我们在一个具有挑战性的OOD情境中严格测试了我们的框架，其中ID和OOD类在语义上接近但又有区别，称为\emph{近}OOD检测。为了全面评估，我们将我们的方法与流行的微调方法进行了基准测试。实验结果表明，我们的方法在少样本ID意图分类和近OOD意图检测任务中表现出色。