LLM2D

摘要

arXiv:2502.07424v2 更新类型: 替换-交叉摘要：尽管大型语言模型（LLMs）主要在以英语为中心的数据集上进行训练，它们在多语言泛化方面表现出惊人的能力。一个基本的问题出现了：LLMs 是如何实现这种稳健的多语言能力的？我们以非罗马字符语言为例，研究罗马化——使用罗马字符表示非罗马字符——作为多语言处理中的桥梁作用。通过使用机制可解释性技术，我们分析了下一个标记生成过程，并发现中间层经常以罗马化形式表示目标词汇，在转换为原生脚本之前，我们称这种现象为潜在罗马化。此外，通过激活补丁实验，我们证明LLMs 在原生脚本和罗马化脚本中以类似的方式编码语义概念，表明存在一个共享的底层表示。另外，对于翻译为非罗马字符语言的研究发现，当目标语言是以罗马化形式表示时，其表示在模型的层中比以原生脚本表示时出现得更早。这些见解加深了我们对LLMs 中多语言表示的理解，并突显了罗马化在促进语言转移中的潜在作用。