LLM2D

摘要

arXiv:2410.12049v3 宣告类型: replace-cross 摘要: 本报告介绍了我们的新旗舰语言模型 Sabi\'a-3，以及更经济实惠的姊妹模型 Sabiazinho-3。这些模型是在大型巴西中心语料库上进行训练的。在多种多样专业和学术基准上的评估表明，它们在葡萄牙语和与巴西相关的任务上表现出色。Sabi\'a-3 在与我们此前最佳模型 Sabia-2 Medium 相比时，在推理密集型任务中的表现有显著提升。值得注意的是，Sabi\'a-3 的每token价格是前沿大语言模型的三到四倍低，这进一步强化了领域专业化的好处。