LLM2D

摘要

arXiv:2502.03916v1 交叉类型: cross 摘要: 大型语言模型（LLMs）在文本生成中越来越有帮助，甚至可以根据用户用自然语言编写的提示编写编程语言中的代码。它们甚至被应用于根据自然语言生成多体系统的模拟模型。研究结果表明，LLMs 超越了简单复制现有代码示例的情况，其中一些LLMs已针对开源多体模拟代码进行了训练。然而，对于封闭源代码的模拟软件，这种情况不容期望，因为它们的想法和概念可能与其他公开可用的版本不同。在知识密集型任务如模型创建中，LLMs可能会出现幻觉，导致错误响应。对于未知的封闭源代码模拟软件尤其如此。同样的情况也适用于其他内部知识，这些知识被保留以保护知识产权或数据隐私。检索增强生成（RAG）方法可能为这些知识密集型任务提供解决方案。本文探讨了RAG在封闭源代码模拟软件中的应用，并进行了初步实验。在简要介绍了LLMs、RAG方法以及封闭源代码模拟软件所使用的模拟方法后，提供了几个示例来测试LLMs对模拟软件的知识以及使用两个RAG系统创建模拟模型的情况。这些示例显示出有前途的结果，表明将RAG系统应用于封闭源代码模拟软件的优势，有助于访问其知识。然而，它们也揭示了所应用信息中的缺口，并提出了进一步研究中的开放式问题。