LLM2D
HW-TSC团队提交的CCMT 2024机器翻译任务结果
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks
作者: Zhanglin Wu, Yuanchang Luo, Daimeng Wei, Jiawei Zheng, Bin Wei, Zongyao Li, Hengchao Shang, Jiaxin Guo, Shaojun Li, Weidong Zhang, Ning Xie, Hao Yang
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2409.14842v3

摘要

华为翻译服务中心(HW-TSC)提交了其参加第20届中国机器翻译大会(CCMT 2024)机器翻译任务的论文。我们参与了双语机器翻译任务和多领域机器翻译任务。针对这两个翻译任务,我们基于深度Transformer-big架构的神经机器翻译(NMT)模型,使用了正则化dropout、双向训练、数据多样化、正向翻译、反向翻译、交替训练、课程学习和转导集成学习等训练策略。此外,为了探索大型语言模型(LLM)是否能够提高NMT系统的翻译质量,我们使用监督微调训练llama2-13b作为自动后期编辑(APE)模型,以改进NMT模型在多领域机器翻译任务上的翻译结果。通过使用这些策略,我们的提交在最终评估中取得了具有竞争力的结果。