摘要
这项工作研究了预训练大型语言模型 (LLM) 在指令其将低资源语言文本翻译成高资源语言(作为自动化机器翻译流程的一部分)时的上下文学习能力。我们进行了一系列将南方克丘亚语翻译成西班牙语的实验,并检查了从受限的数字化教学材料(字典和语法课程)和平行语料库中检索到的各种上下文的信息量。使用模型输出的自动和人工评估,我们进行了消融研究,操纵了 (1) 上下文类型(词素翻译、语法描述和语料库示例),(2) 检索方法(自动与手动),以及 (3) 模型类型。我们的结果表明,即使是相对较小的 LLM,在提供足够数量的相关语言信息时,也能够利用提示上下文进行零样本低资源翻译。然而,上下文类型、检索方法、模型类型和特定语言因素的可变影响突出了将最好的 LLM 用作世界上 7000 多种语言及其使用者翻译系统的局限性。