摘要
arXiv:2502.04384v1 Announce Type: 横向交叉
摘要:本文介绍了SOLOMON,这是一种新颖的神经启发型大规模语言模型(LLM)推理网络架构,旨在增强基础模型在特定领域应用中的适应性。通过在半导体布局设计中的案例研究,我们展示了SOLOMON如何通过利用提示工程技术及上下文学习技术,使通用的LLM迅速适应专门任务。我们的实验揭示了LLM在空间推理和将领域知识应用于实际问题时面临的挑战。结果显示,SOLOMON实例显著优于基准LLM,并达到与先进推理模型o1-preview相当的性能。我们讨论了未来研究方向,以开发更多适应性强的AI系统,使其能够不断学习、适应并响应新的信息和变化的需求。