LLM2D

摘要

arXiv:2505.00114v1 交叉类型：cross 摘要：本文研究了大型语言模型（LLMs）在翻译低资源黎巴嫩方言方面的有效性，重点关注文化贴近数据与更大规模翻译数据集的影响。我们比较了三种微调方法：基础方法、对比微调和语法提示微调，使用开源Aya23模型。实验结果显示，使用较小但文化意识较强的黎巴嫩数据集（LW）进行微调的模型始终优于使用更大规模非母语数据集进行训练的模型。通过使用对比微调结合对比提示的方法获得了最佳结果，这表明让翻译模型接触不良示例的好处。此外，为了确保真实性评估，我们引入了LebEval这一新基准，该基准源自本土黎巴嫩内容，并将其与现有的FLoRes基准进行比较。我们的研究发现挑战了“更多数据更好”的范式，并强调了在方言翻译中文化贴近性的重要性。我们已将数据集和代码发布在Github上。