LLM2D

摘要

大型语言模型 (LLM) 在常见任务上表现良好，但在低资源和低计算环境下的泛化能力却很差。我们通过在英泰机器翻译和代码切换数据集上测试各种 LLM 和专用翻译模型来检验这一局限性。我们的研究结果表明，在更严格的计算约束下，例如 4 位量化，LLM 无法有效翻译。相比之下，具有相当或更低计算需求的专用模型始终优于 LLM。这凸显了专用模型在资源受限条件下保持性能的重要性。