LLM2D
HW-TSC 提交给 CCMT 2024 机器翻译任务的报告
HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.14842v1

摘要

本文介绍了华为翻译服务中心(HW-TSC)在第20届中国机器翻译大会(CCMT 2024)机器翻译任务中的提交内容。我们参与了双语机器翻译任务和多领域机器翻译任务。对于这两项翻译任务,我们采用了正则化丢弃、双向训练、数据多样化、前向翻译、后向翻译、交替训练、课程学习以及转导集成学习等训练策略,基于深度Transformer-big架构训练神经机器翻译(NMT)模型。此外,为了探索大型语言模型(LLM)是否能帮助提升NMT系统的翻译质量,我们使用监督微调训练了llama2-13b作为自动后编辑(APE)模型,以改进NMT模型在多领域机器翻译任务中的翻译结果。通过运用这些策略,我们的提交在最终评估中取得了有竞争力的成绩。