LLM2D

摘要

arXiv:2505.07857v1 交叉类型：摘要：为不同的语言开发了多种意图检测预测器，包括英语、中文和法语，然而，乌尔都语——世界上第十大常用语言——的领域仍然发展不足。在常见语言领域，意图检测预测器利用少量样本学习和基于已见过类别的模型预测未见过的类别的策略。然而，乌尔都语缺乏基于少量样本的学习意图检测预测器，传统的预测器则主要集中在模型在训练集中见过的类别上。为了增强乌尔都语特定意图检测，本文介绍了一种独特的对比学习方法，该方法利用未标记的乌尔都语数据重新训练预训练语言模型。这种重新训练增强了大语言模型在下游意图检测任务中的表示学习能力。最后，该方法综合利用预训练的大语言模型和原型信息注意力机制，构建了一个全面的端到端的LLMPIA意图检测管道。在提出的预测管道框架下，它探索了6种不同的语言模型和13种不同相似性计算方法的潜力。提出的框架在两个公开基准数据集ATIS（包含5836个样本）和Web Queries（包含8519个样本）上进行了评估。在ATIS数据集的4-shot和5-shot实验设置下，LLMPIA分别实现了83.28%和98.25%的F1分数，在Web Queries数据集上分别实现了76.23%和84.42%的F1分数。在Web Queries数据集上的额外案例研究中，在相同的训练集和测试集设置下，LLMPIA比最先进的预测器高出了53.55%的F1分数。