LLM2D
面向系统化的单语NLP综述:关于希腊NLPгенерация
Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP
作者: Juli Bakagianni, Kanella Pouli, Maria Gavriilidou, John Pavlopoulos
发布日期: 2/3/2025
arXiv ID: oai:arXiv.org:2407.09861v3

摘要

arXiv:2407.09861v3 宣布类型: replace-cross 摘要:自然语言处理(NLP)研究传统上主要集中在英语上,这主要是由于资源的可用性、研究社区的规模以及市场需求的驱动。最近,NLP领域开始注意到多语言的重要性,认识到在多种语言和文化中实现包容性和有效性的重要性。单一语言的调查有可能补充NLP领域多语言的趋势,通过提供基础见解和资源,有助于有效应对全球沟通中的语言多样性。然而,在文献中,单一语言的NLP调查极为罕见。本研究介绍了创建系统性和全面的单一语言NLP调查的一般可迁移方法,旨在优化此类调查的构建过程,并全面解决一种语言的NLP支持问题。我们的方法整合了一种结构化的搜索协议,以避免选择偏差并确保可重复性,一种NLP任务分类法,用于有条理地组织调查材料,并使用语言资源分类法(LRs)来识别潜在的基准,并突出改善资源可用性(如通过更好的维护或许可)的机会。我们通过此方法对希腊NLP(2012-2023)进行了应用,提供了其当前状态及其挑战的全面概述。我们讨论了希腊NLP的进步,并列出了被分类为可用性和可用性的希腊语言资源,评估了每项NLP任务的语言支持情况。呈示的系统文献综述为希腊NLP提供了一个应用,展示了单一语言NLP调查在更广泛范围内的优势。类似的应用可以考虑应用于NLP进展落后于支持良好语言的无数其他语言。