LLM2D
基于检索增强生成的大语言模型实验及其在闭源仿真软件中的应用
Experiments with Large Language Models on Retrieval-Augmented Generation for Closed-Source Simulation Software
作者: Andreas Baumann, Peter Eberhard
发布日期: 2/7/2025
arXiv ID: oai:arXiv.org:2502.03916v1

摘要

arXiv:2502.03916v1 交叉类型: cross 摘要: 大型语言模型(LLMs)在文本生成中越来越有帮助,甚至可以根据用户用自然语言编写的提示编写编程语言中的代码。它们甚至被应用于根据自然语言生成多体系统的模拟模型。研究结果表明,LLMs 超越了简单复制现有代码示例的情况,其中一些LLMs已针对开源多体模拟代码进行了训练。然而,对于封闭源代码的模拟软件,这种情况不容期望,因为它们的想法和概念可能与其他公开可用的版本不同。在知识密集型任务如模型创建中,LLMs可能会出现幻觉,导致错误响应。对于未知的封闭源代码模拟软件尤其如此。同样的情况也适用于其他内部知识,这些知识被保留以保护知识产权或数据隐私。检索增强生成(RAG)方法可能为这些知识密集型任务提供解决方案。本文探讨了RAG在封闭源代码模拟软件中的应用,并进行了初步实验。在简要介绍了LLMs、RAG方法以及封闭源代码模拟软件所使用的模拟方法后,提供了几个示例来测试LLMs对模拟软件的知识以及使用两个RAG系统创建模拟模型的情况。这些示例显示出有前途的结果,表明将RAG系统应用于封闭源代码模拟软件的优势,有助于访问其知识。然而,它们也揭示了所应用信息中的缺口,并提出了进一步研究中的开放式问题。