LLM2D
越南语-日语翻译的全面管道
VNJPTranslate: A comprehensive pipeline for Vietnamese-Japanese translation
作者: Hoang Hai Phan, Nguyen Duc Minh Vu, Nam Dang Phuong
发布日期: 4/2/2025
arXiv ID: oai:arXiv.org:2504.00339v1

摘要

arXiv:2504.00339v1 交叉类型: 摘要:由Transformer架构驱动的神经机器翻译(NMT)取得了显著进展,但仍然面临如越南语-日语(Vi-Ja)等低资源语言对的挑战。这些问题包括稀疏的平行数据和处理语言/文化差异。近年来,通过强化学习(RL)进行优化的大语言模型(LLMs)的进步,能够生成高质量的合成数据。我们引入了VNJPTranslate,这是一种旨在系统解决Vi-Ja翻译任务的管道。它使用先进的LLMs和链式思维提示策略进行数据扩增,特别针对通过语料库分析识别出的具有挑战性的段落。随后,我们使用高效的微调技术(Unsloth结合QLoRA)在一个具备强大性能且参数量较少的自回归模型(具体来说,是基于Qwen架构的1.8B参数Sailor模型的微调版本)上进行微调,以创建一个实际可行且高性能的翻译系统。这种综合方法旨在显著提高Vi-Ja翻译的质量,超越现有baseline系统。