LLM2D
Sabi\'a-3 技术报告
Sabi\'a-3 Technical Report
作者: Hugo Abonizio, Thales Sales Almeida, Thiago Laitz, Roseval Malaquias Junior, Giovana Kerche Bon\'as, Rodrigo Nogueira, Ramon Pires
发布日期: 4/2/2025
arXiv ID: oai:arXiv.org:2410.12049v4

摘要

arXiv:2410.12049v4 宣告类型: replace-cross 摘要:本报告介绍我们新的旗舰语言模型 Sabi\'a-3 及其更具成本效益的兄弟模型 Sabiazinho-3。这些模型在大型以巴西为中心的语料库上进行了训练。跨多个专业和学术基准的评估显示,该模型在葡萄牙语和与巴西相关任务上的表现非常出色。与我们之前的最佳模型 Sabia-2 Medium 相比,Sabi\'a-3 在涉及推理的任务中表现出显著的提升。值得注意的是,Sabi\'a-3 的平均性能与前沿语言模型相当,同时其每token的成本仅为后者三到四倍,这进一步证明了领域专业化的好处。