LLM2D

摘要

华为翻译服务中心（HW-TSC）提交了其参加第20届中国机器翻译大会（CCMT 2024）机器翻译任务的论文。我们参与了双语机器翻译任务和多领域机器翻译任务。针对这两个翻译任务，我们基于深度Transformer-big架构的神经机器翻译（NMT）模型，使用了正则化dropout、双向训练、数据多样化、正向翻译、反向翻译、交替训练、课程学习和转导集成学习等训练策略。此外，为了探索大型语言模型（LLM）是否能够提高NMT系统的翻译质量，我们使用监督微调训练llama2-13b作为自动后期编辑（APE）模型，以改进NMT模型在多领域机器翻译任务上的翻译结果。通过使用这些策略，我们的提交在最终评估中取得了具有竞争力的结果。