LLM2D

摘要

本文介绍了华为翻译服务中心（HW-TSC）在第 20 届中国机器翻译大会（CCMT 2024）机器翻译任务中的参赛方案。我们参加了双语机器翻译任务和多领域机器翻译任务。对于这两个翻译任务，我们基于深度 Transformer-big 架构，使用正则化 dropout、双向训练、数据多样化、正向翻译、反向翻译、交替训练、课程学习和转导集成学习等训练策略来训练神经机器翻译（NMT）模型。此外，为了探索大型语言模型（LLM）是否可以帮助提高 NMT 系统的翻译质量，我们使用监督微调训练 llama2-13b 作为自动后期编辑（APE）模型，以改善 NMT 模型在多领域机器翻译任务上的翻译结果。通过使用这些多方面的策略，我们的参赛方案在最终评估中取得了具有竞争力的结果。