LLM2D

摘要

arXiv:2504.00289v2 通告类型: 更换-交叉摘要：顶级开源预训练大语言模型（LLM）的发布，进一步确立了中国的主导地位，使其成为AI发展的重要力量。这些模型支持中国使用的语言吗？还是它们使用与西方模型相同的语言？比较多语言能力的原因主要有两个。首先，语言能力提供了预训练数据收集的见解，从而影响资源分配和开发优先级。其次，中国有着关于语言政策的长期明确历史，从少数语言的包容性政策到以普通话为主的政策之间有所变化。为了测试当前中国大语言模型是否反映了关于中国语言的政策议程，我们测试了中国和西方开源大语言模型在亚洲区域和中国少数民族语言上的表现。我们在信息公平性和阅读理解方面的实验表明，中国模型和西方模型在这类语言上的表现相关性很强（r=0.93），唯一的例外是普通话表现更好。有时，中国模型无法识别诸如哈萨克语和维吾尔语等中国少数民族使用的语言，尽管它们在法语和德语识别上表现良好。这些结果展示了当前的开发优先级，提出了未来开发的选项，并为最终用户提供了指导。