LLM2D
桥梁语言障碍:大规模语言模型在机器翻译中应用的综述
Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation
作者: Baban Gain, Dibyanayan Bandyopadhyay, Asif Ekbal
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.01919v2

摘要

arXiv:2504.01919v2 公告类型: replace-cross 摘要:大型语言模型(LLMs)的出现显著重塑了机器翻译(MT)的格局,特别是在资源匮乏的语言和领域中,这些领域缺乏足够的平行语料库、语言工具和计算基础设施。本文综述了利用LLMs进行MT的最新进展。我们分析了诸如少量示例提示、跨语言迁移和参数高效微调等技术,这些技术能够有效适应资源匮乏的环境。文章还探讨了使用LLMs生成合成数据的策略,包括回译和词汇扩充。此外,我们比较了基于LLMs的翻译与传统编码器-解码器模型在多种语言对中的表现,突出了每种模型的优势和局限性。我们讨论了持续存在的挑战,如幻觉现象、评估不一致性和继承的偏见,并评估了新兴的LLM驱动的翻译质量指标。本文为构建在大规模生成模型时代健壮、包容和可扩展的MT系统的实践见解提供了指导,并提出了未来方向。