LLM2D
增强推理以适应大型语言模型在特定领域应用
Enhancing Reasoning to Adapt Large Language Models for Domain-Specific Applications
作者: Bo Wen, Xin Zhang
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2502.04384v1

摘要

arXiv:2502.04384v1 Announce Type: 横向交叉 摘要:本文介绍了SOLOMON,这是一种新颖的神经启发型大规模语言模型(LLM)推理网络架构,旨在增强基础模型在特定领域应用中的适应性。通过在半导体布局设计中的案例研究,我们展示了SOLOMON如何通过利用提示工程技术及上下文学习技术,使通用的LLM迅速适应专门任务。我们的实验揭示了LLM在空间推理和将领域知识应用于实际问题时面临的挑战。结果显示,SOLOMON实例显著优于基准LLM,并达到与先进推理模型o1-preview相当的性能。我们讨论了未来研究方向,以开发更多适应性强的AI系统,使其能够不断学习、适应并响应新的信息和变化的需求。