摘要
arXiv:2505.08004v1 交叉公告类型
摘要:在过去三年里,大型语言模型(LLMs)的快速发展对人工智能的多个领域产生了深远影响,特别是在多种语言的自然语言处理(NLP)方面,包括阿拉伯语。尽管阿拉伯语是阿拉伯世界27个国家中最广泛使用的语言之一,并且在一些非阿拉伯国家也被用作第二语言,但阿拉伯语资源、数据集和工具仍然稀缺。由于阿拉伯语的丰富形态、复杂的结构、多样化的书写标准等复杂性因素,阿拉伯语NLP任务面临着各种挑战。研究人员一直在积极应对这些挑战,表明在多语言语料库上预训练的大型语言模型在多种阿拉伯语NLP任务中取得了显著的成功。本文概述了使用大型语言模型(LLMs)进行阿拉伯语处理的情况,突出了跨多种NLP应用的早期预训练阿拉伯语模型及其处理多样化的阿拉伯语内容任务和方言的能力。此外,本文还概述了如何通过微调和提示工程等技术提高这些模型的性能。此外,本研究总结了常见的阿拉伯语基准和数据集,并呈现了我们对LLMs采用持续上升趋势的观察。