LLM2D
Home
Arxiv
返回列表
通用大型语言模型能否泛化到英泰机器翻译?
Can General-Purpose Large Language Models Generalize to English-Thai Machine Translation ?
作者:
Jirat Chiaranaipanich, Naiyarat Hanmatheekuna, Jitkapat Sawatphol, Krittamate Tiankanon, Jiramet Kinchagawat, Amrest Chinkamol, Parinthapat Pengpun, Piyalitt Ittichaiwong, Peerat Limkonchotiwat
发布日期:
10/23/2024
arXiv ID:
oai:arXiv.org:2410.17145v1
摘要
大型语言模型 (LLM) 在常见任务上表现良好,但在低资源和低计算环境下的泛化能力却很差。我们通过在英泰机器翻译和代码切换数据集上测试各种 LLM 和专用翻译模型来检验这一局限性。我们的研究结果表明,在更严格的计算约束下,例如 4 位量化,LLM 无法有效翻译。相比之下,具有相当或更低计算需求的专用模型始终优于 LLM。这凸显了专用模型在资源受限条件下保持性能的重要性。
查看原文
下载 PDF