LLM2D

摘要

arXiv:2504.00289v1 交叉公告类型：摘要：顶级开源大语言模型的发布已经确立了中国在全球人工智能开发领域的领先地位。这些模型支持中国使用的语言吗？还是与西方模型使用的语言相同？比较多语言能力有两方面的原因。首先，语言能力提供了有关预训练数据收集的洞察，从而揭示了资源分配和开发优先事项。其次，中国有着悠久的语言政策历史，政策内容从少数语言包容到以普通话为主。为了测试当今中国和西方开源大语言模型是否反映了关于中国语言的议程，我们在东亚区域和中国少数民族语言上测试了这些模型的性能。我们的实验显示，中国模型在这几种语言上的表现（信息平等和阅读理解）与西方模型的相关性很强（r=0.93），唯一的例外是普通话更优秀。有时，中国模型无法识别如哈萨克语和维吾尔语等中国少数民族的语言，尽管它们在法语和德语上表现良好。这些结果揭示了当前的开发优先事项，提供了未来发展的选项，并为最终用户提供了指导。