LLM2D
ModiGen:基于大型语言模型的多任务Modelica代码生成工作流
ModiGen: A Large Language Model-Based Workflow for Multi-Task Modelica Code Generation
作者: Jiahui Xiang, Tong Ye, Peiyu Liu, Yinan Zhang, Wenhai Wang
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2503.18460v1

摘要

arXiv:2503.18460v1 Announce Type: 交叉 摘要:Modelica 是广泛采用的一种用于模拟复杂物理系统的语言,然而有效的模型创建和优化仍然需要大量的领域专业知识。尽管大型语言模型(LLMs)在代码生成方面展示了潜力,但它们在建模中的应用尚未得到充分探索。为解决这一差距,我们开发了专门设计的基准数据集,旨在评估 LLMs 在生成 Modelica 组件模型和测试案例方面的性能,并进行测试。我们的评估揭示了当前 LLMs 的显著局限性,因为生成的代码往往无法成功模拟。为了克服这些挑战,我们提出了一种专门的工作流,该工作流结合了监督微调、图检索增强生成和反馈优化,以提高 Modelica 代码生成的准确性和可靠性。评估结果表明显著的性能增益:组件生成任务中的 pass@1 最大改进达到了 0.3349,测试案例生成任务中的最大改进达到了 0.2457。这项研究强调了 LLMs 在推进智能建模工具方面的潜力,并为系统建模和工程应用的未来开发提供了有价值的见解。