LLM2D
HW-TSC 提交至 2024 年中国机器翻译大会机器翻译任务的论文
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks
作者: Zhanglin Wu, Yuanchang Luo, Daimeng Wei, Jiawei Zheng, Bin Wei, Zongyao Li, Hengchao Shang, Jiaxin Guo, Shaojun Li, Weidong Zhang, Ning Xie, Hao Yang
发布日期: 9/30/2024
arXiv ID: oai:arXiv.org:2409.14842v2

摘要

本文介绍了华为翻译服务中心(HW-TSC)在第 20 届中国机器翻译大会(CCMT 2024)机器翻译任务中的参赛方案。我们参加了双语机器翻译任务和多领域机器翻译任务。对于这两个翻译任务,我们基于深度 Transformer-big 架构,使用正则化 dropout、双向训练、数据多样化、正向翻译、反向翻译、交替训练、课程学习和转导集成学习等训练策略来训练神经机器翻译(NMT)模型。此外,为了探索大型语言模型(LLM)是否可以帮助提高 NMT 系统的翻译质量,我们使用监督微调训练 llama2-13b 作为自动后期编辑(APE)模型,以改善 NMT 模型在多领域机器翻译任务上的翻译结果。通过使用这些多方面的策略,我们的参赛方案在最终评估中取得了具有竞争力的结果。