LLM2D

摘要

在这项工作中，我们介绍了神经机器翻译 (NMT) 模型的指令微调，它将大型语言模型 (LLM) 的指令遵循能力提炼到规模小得多的 NMT 模型中。我们针对 NMT 模型的指令微调方案能够针对有限但不同的翻译特定任务定制翻译。我们表明，NMT 模型能够同时遵循多个指令，并展示了指令零样本组合的能力。我们还表明，通过指令微调，传统上不同的任务，例如形式控制机器翻译、多领域适应以及多模态翻译，可以通过单个指令微调的 NMT 模型联合解决，其性能水平与 GPT-3.5-Turbo 等 LLM 相当。据我们所知，我们的工作是首批展示传统 NMT 模型的指令遵循能力的工作之一，这使得能够更快、更便宜、更高效地提供定制翻译。