LLM2D
Geo-OLM:以成本高效的开放语言模型及状态驱动的工作流 enabling 可持续的地球观测研究
Geo-OLM: Enabling Sustainable Earth Observation Studies with Cost-Efficient Open Language Models & State-Driven Workflows
作者: Dimitrios Stamoulis, Diana Marculescu
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.04319v1

摘要

arXiv:2504.04319v1 Announce Type: cross 摘要:地理空间副驾在自动化地球观测(EO)和气候监测工作流方面具有巨大的潜力,但它们对大规模模型(如GPT-4o)的依赖性产生了一个悖论:旨在进行可持续性研究的工具往往会导致不可持续的成本。在地理空间应用中使用自主AI框架会累积数千美元的API费用,或者需要成本高昂且耗能大的GPU进行部署,从而为研究人员、政策制定者和NGO设置了障碍。不幸的是,当地理空间副驾与开放语言模型(OLMs)一起部署时,性能往往会下降,因为它们依赖于经过GPT优化的逻辑。在这篇文章中,我们提出了Geo-OLM,这是一种工具增强的地理空间代理,利用了新型的状态驱动的大语言模型(LLMs)推理范式,解除了任务进展与工具调用的耦合。通过缓解工作流推理的负担,我们的方法使低成本的OLMs能够更有效地完成地理空间任务。当将模型缩小到7B参数以下时,Geo-OLM在成功查询完成率方面比最强的先前地理空间基线高出32.8%。我们的方法与实现结果接近GPT-4o的专有模型相当,同时将推理成本减少了两个数量级,从500-1000美元降至不到10美元。我们提供了地理空间下游基准的深入分析,为从业者有效地部署OLMs进行EO应用提供了关键见解。