摘要
arXiv:2504.01919v1 宣告类型: cross
摘要:大型语言模型(LLMs)的到来显著改变了机器翻译(MT)的格局,尤其是在低资源语言和缺乏足够平行语料库、语言工具和计算基础设施的领域。本文综述了利用LLMs进行MT的最近进展。我们分析了诸如少样本提示、跨语言转移和参数高效微调等技术,这些技术使LLMs能够有效地适应资源不足的环境。文章还探讨了使用LLMs生成合成数据的策略,包括反向翻译和词汇增广。此外,我们比较了基于LLMs的翻译与传统的编码器-解码器模型在多种语言对上的表现,突出了每种方法的优点和局限性。我们讨论了持续存在的挑战,如幻觉、评估不一致性和继承的偏见,同时评估了新兴的LLM驱动的翻译质量评价指标。本文提供了实用的见解,并概述了在大规模生成模型时代构建稳健、包容和可扩展的MT系统的未来方向。