摘要
arXiv:2410.12049v3 宣告类型: replace-cross
摘要: 本报告介绍了我们的新旗舰语言模型 Sabi\'a-3,以及更经济实惠的姊妹模型 Sabiazinho-3。这些模型是在大型巴西中心语料库上进行训练的。在多种多样专业和学术基准上的评估表明,它们在葡萄牙语和与巴西相关的任务上表现出色。Sabi\'a-3 在与我们此前最佳模型 Sabia-2 Medium 相比时,在推理密集型任务中的表现有显著提升。值得注意的是,Sabi\'a-3 的每token价格是前沿大语言模型的三到四倍低,这进一步强化了领域专业化的好处。