LLM2D

摘要

arXiv:2503.17604v2 宣告类型: 替换摘要：大规模语言模型（LLMs）在推进科学知识和解决复杂挑战方面展现出了非凡的潜力。在这项工作中，我们介绍了OmniScience，这是一个专门为通用科学设计的专用大规模推理模型，通过三个关键组成部分开发：（1）在精心筛选的科学文献语料库上进行领域适配的预训练，（2）在特定数据集上的指令调优以引导模型执行领域特定任务，以及（3）通过微调进行基于推理的知识精化，以显著增强其生成上下文相关且逻辑严密的响应的能力。通过开发一个电池代理来高效地评估分子作为潜在电解质溶剂或添加剂的潜力，我们展示了OmniScience的灵活性。全面的评估表明，与其他参数数量相似的最先进的大规模推理模型相比，OmniScience在GPQA Diamond和领域特定的电池基准测试中具有竞争力，而在所有公开的推理和非推理模型中表现更优。我们还通过消融实验进一步证明，领域适配的预训练和基于推理的知识精化对于达到我们的性能水平是至关重要的，这一点在所有基准测试中都是成立的。