摘要
本文介绍了华为翻译服务中心(HW-TSC)在第 20 届中国机器翻译大会(CCMT 2024)机器翻译任务中的参赛方案。我们参加了双语机器翻译任务和多领域机器翻译任务。对于这两个翻译任务,我们基于深度 Transformer-big 架构,使用正则化 dropout、双向训练、数据多样化、正向翻译、反向翻译、交替训练、课程学习和转导集成学习等训练策略来训练神经机器翻译(NMT)模型。此外,为了探索大型语言模型(LLM)是否可以帮助提高 NMT 系统的翻译质量,我们使用监督微调训练 llama2-13b 作为自动后期编辑(APE)模型,以改善 NMT 模型在多领域机器翻译任务上的翻译结果。通过使用这些多方面的策略,我们的参赛方案在最终评估中取得了具有竞争力的结果。