LLM2D
Sabi\'a-3技术报告
Sabi\'a-3 Technical Report
作者: Hugo Abonizio, Thales Sales Almeida, Thiago Laitz, Roseval Malaquias Junior, Giovana Kerche Bon\'as, Rodrigo Nogueira, Ramon Pires
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2410.12049v3

摘要

arXiv:2410.12049v3 宣告类型: replace-cross 摘要: 本报告介绍了我们的新旗舰语言模型 Sabi\'a-3,以及更经济实惠的姊妹模型 Sabiazinho-3。这些模型是在大型巴西中心语料库上进行训练的。在多种多样专业和学术基准上的评估表明,它们在葡萄牙语和与巴西相关的任务上表现出色。Sabi\'a-3 在与我们此前最佳模型 Sabia-2 Medium 相比时,在推理密集型任务中的表现有显著提升。值得注意的是,Sabi\'a-3 的每token价格是前沿大语言模型的三到四倍低,这进一步强化了领域专业化的好处。