LLM2D

摘要

arXiv:2504.01919v2 公告类型: replace-cross 摘要：大型语言模型（LLMs）的出现显著重塑了机器翻译（MT）的格局，特别是在资源匮乏的语言和领域中，这些领域缺乏足够的平行语料库、语言工具和计算基础设施。本文综述了利用LLMs进行MT的最新进展。我们分析了诸如少量示例提示、跨语言迁移和参数高效微调等技术，这些技术能够有效适应资源匮乏的环境。文章还探讨了使用LLMs生成合成数据的策略，包括回译和词汇扩充。此外，我们比较了基于LLMs的翻译与传统编码器-解码器模型在多种语言对中的表现，突出了每种模型的优势和局限性。我们讨论了持续存在的挑战，如幻觉现象、评估不一致性和继承的偏见，并评估了新兴的LLM驱动的翻译质量指标。本文为构建在大规模生成模型时代健壮、包容和可扩展的MT系统的实践见解提供了指导，并提出了未来方向。