摘要
在这项工作中,我们介绍了神经机器翻译 (NMT) 模型的指令微调,它将大型语言模型 (LLM) 的指令遵循能力提炼到规模小得多的 NMT 模型中。我们针对 NMT 模型的指令微调方案能够针对有限但不同的翻译特定任务定制翻译。我们表明,NMT 模型能够同时遵循多个指令,并展示了指令零样本组合的能力。我们还表明,通过指令微调,传统上不同的任务,例如形式控制机器翻译、多领域适应以及多模态翻译,可以通过单个指令微调的 NMT 模型联合解决,其性能水平与 GPT-3.5-Turbo 等 LLM 相当。据我们所知,我们的工作是首批展示传统 NMT 模型的指令遵循能力的工作之一,这使得能够更快、更便宜、更高效地提供定制翻译。