LLM2D

摘要

地球科学领域对时空数据和建模任务的需求日益增长，使得地理空间代码生成技术成为提高生产力的关键因素。尽管大型语言模型 (LLM) 在代码生成任务中展现出潜力，但由于缺乏领域特定知识和代码语料库，它们在地理空间代码生成中常常遇到拒绝生成代码或出现幻觉等问题。为了应对这些挑战，本文提出并开源了 GeoCode-PT 和 GeoCode-SFT 语料库，以及 GeoCode-Eval 评估数据集。此外，我们利用 QLoRA 和 LoRA 进行预训练和微调，推出了 GeoCode-GPT-7B，这是第一个专注于地理空间代码生成的 LLM，它基于 Code Llama-7B 微调而来。此外，我们建立了一个全面的地理空间代码评估框架，该框架结合了选项匹配、专家验证和提示工程评分，并使用 GeoCode-Eval 数据集系统地评估了 GeoCode-GPT-7B。实验结果表明，GeoCode-GPT 在多项选择准确率上比其他模型高出 9.1% 到 32.1%，在代码总结能力上高出 1.7% 到 25.4%，在代码生成能力上高出 1.2% 到 25.1%。本文为提高大型语言模型在地理空间代码生成中的性能提供了一种解决方案和实证验证，扩展了特定领域模型应用的边界，并为释放其在地理空间代码生成中的潜力提供了宝贵的见解。