LLM2D
工程领域的LLMs:教模型设计高性能火箭
LLMs for Engineering: Teaching Models to Design High Powered Rockets
作者: Toby Simonds
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2504.19394v1

摘要

arXiv:2504.19394v1 公告类型:交叉 摘要:大型语言模型(LLMs)已经改变了软件工程领域,但其在物理工程领域的应用仍然没有得到充分探索。本文通过RocketBench,一个将LLMs连接到高保真火箭模拟的基准测试,评估了LLMs在高功率火箭设计中的能力。我们测试了模型在两个越来越复杂的任务上:目标高度优化和精确着陆挑战。我们的研究表明,尽管最先进的LLMs展示了强大的基本工程知识,但在收到模拟结果后,它们难以迭代改进设计,并最终在性能上落后于人类水平。然而,当通过强化学习(RL)增强时,我们展示了拥有70亿参数的模型不仅超过了最先进的基础模型,还超过了人类专家。本研究表明,经过RL训练的LLMs可以作为复杂工程优化的有效工具,有可能在软件开发之外的其他工程领域进行改造。