LLM2D

摘要

这项工作研究了预训练大型语言模型 (LLM) 在指令其将低资源语言文本翻译成高资源语言（作为自动化机器翻译流程的一部分）时的上下文学习能力。我们进行了一系列将南方克丘亚语翻译成西班牙语的实验，并检查了从受限的数字化教学材料（字典和语法课程）和平行语料库中检索到的各种上下文的信息量。使用模型输出的自动和人工评估，我们进行了消融研究，操纵了 (1) 上下文类型（词素翻译、语法描述和语料库示例），(2) 检索方法（自动与手动），以及 (3) 模型类型。我们的结果表明，即使是相对较小的 LLM，在提供足够数量的相关语言信息时，也能够利用提示上下文进行零样本低资源翻译。然而，上下文类型、检索方法、模型类型和特定语言因素的可变影响突出了将最好的 LLM 用作世界上 7000 多种语言及其使用者翻译系统的局限性。