LLM2D

摘要

arXiv:2504.01919v1 宣告类型: cross 摘要：大型语言模型（LLMs）的到来显著改变了机器翻译（MT）的格局，尤其是在低资源语言和缺乏足够平行语料库、语言工具和计算基础设施的领域。本文综述了利用LLMs进行MT的最近进展。我们分析了诸如少样本提示、跨语言转移和参数高效微调等技术，这些技术使LLMs能够有效地适应资源不足的环境。文章还探讨了使用LLMs生成合成数据的策略，包括反向翻译和词汇增广。此外，我们比较了基于LLMs的翻译与传统的编码器-解码器模型在多种语言对上的表现，突出了每种方法的优点和局限性。我们讨论了持续存在的挑战，如幻觉、评估不一致性和继承的偏见，同时评估了新兴的LLM驱动的翻译质量评价指标。本文提供了实用的见解，并概述了在大规模生成模型时代构建稳健、包容和可扩展的MT系统的未来方向。