LLM2D

摘要

arXiv:2503.18460v1 Announce Type: 交叉摘要：Modelica 是广泛采用的一种用于模拟复杂物理系统的语言，然而有效的模型创建和优化仍然需要大量的领域专业知识。尽管大型语言模型（LLMs）在代码生成方面展示了潜力，但它们在建模中的应用尚未得到充分探索。为解决这一差距，我们开发了专门设计的基准数据集，旨在评估 LLMs 在生成 Modelica 组件模型和测试案例方面的性能，并进行测试。我们的评估揭示了当前 LLMs 的显著局限性，因为生成的代码往往无法成功模拟。为了克服这些挑战，我们提出了一种专门的工作流，该工作流结合了监督微调、图检索增强生成和反馈优化，以提高 Modelica 代码生成的准确性和可靠性。评估结果表明显著的性能增益：组件生成任务中的 pass@1 最大改进达到了 0.3349，测试案例生成任务中的最大改进达到了 0.2457。这项研究强调了 LLMs 在推进智能建模工具方面的潜力，并为系统建模和工程应用的未来开发提供了有价值的见解。