LLM2D
面向话语层级的文学翻译:上下文感知和风格相关增量解码框架
Context-aware and Style-related Incremental Decoding framework for Discourse-Level Literary Translation
作者: Yuanchang Luo, Jiaxin Guo, Daimeng Wei, Hengchao Shang, Zongyao Li, Zhanglin Wu, Zhiqiang Rao, Shaojun Li, Jinlong Yang, Hao Yang
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.16539v2

摘要

本报告概述了我们针对 WMT24 话语级文学翻译任务的方案,重点关注约束赛道中的中英语言对。文学作品的翻译面临着巨大的挑战,因为这类作品中存在着细微的含义、习语表达和复杂的叙事结构。为了应对这些挑战,我们利用了中文-Llama2 模型,并通过持续预训练 (CPT) 和监督微调 (SFT) 的结合,专门增强了该模型以适应此任务。我们的方法包括一个新颖的增量解码框架,该框架确保每个句子在翻译时都考虑其更广泛的语境,从而在整个文本中保持连贯性和一致性。这种方法使模型能够捕获长距离依赖关系和风格元素,从而生成忠实保留原文文学品质的译文。我们的实验表明,句子级和文档级 BLEU 分数都获得了显著的提升,这突出了我们提出的框架在应对文档级文学翻译复杂性方面的有效性。