LLM2D

摘要

arXiv:2410.12049v4 宣告类型: replace-cross 摘要：本报告介绍我们新的旗舰语言模型 Sabi\'a-3 及其更具成本效益的兄弟模型 Sabiazinho-3。这些模型在大型以巴西为中心的语料库上进行了训练。跨多个专业和学术基准的评估显示，该模型在葡萄牙语和与巴西相关任务上的表现非常出色。与我们之前的最佳模型 Sabia-2 Medium 相比，Sabi\'a-3 在涉及推理的任务中表现出显著的提升。值得注意的是，Sabi\'a-3 的平均性能与前沿语言模型相当，同时其每token的成本仅为后者三到四倍，这进一步证明了领域专业化的好处。