LLM2D
西班牙语本族词义消歧:一项全面的词汇评估资源
Word Sense Disambiguation in Native Spanish: A Comprehensive Lexical Evaluation Resource
作者: Pablo Ortega, Jordi Luque, Luis Lamiable, Rodrigo L\'opez, Richard Benjamins
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.20524v1

摘要

人类语言旨在传达意义,但本质上存在歧义。这给语音和语言处理带来了挑战,但也发挥着重要的沟通功能。有效地解决歧义既是期望也是必要的特征。词语在语境中的词汇意义可以通过词义消歧 (WSD) 算法自动确定,这些算法依赖于外部知识,而这些知识通常有限且偏向英语。在将内容改编成其他语言时,自动翻译经常不准确,需要高度的人工专家验证来确保准确性和理解。本研究通过引入一种新的西班牙语 WSD 资源来解决以前存在的局限性。它包括一个词义清单和一个词汇数据集,这些数据集来自西班牙皇家学院维护的《西班牙语词典》。我们还回顾了西班牙语的现有资源,并通过最先进的系统报告了它们的指标。