摘要
arXiv:2504.12110v1 通告类型: 新
摘要: 地球观测(Earth Observation, EO)为环境监测、灾害管理、气候科学及其他科学领域提供了关键的行星数据。这里我们询问: AI 系统是否准备好进行可靠的地球观测了?我们引入了 \datasetnamenospace,这是一个基于 NASA 地球观测站文章的数据集,共包含 140 个是/否问题,涵盖了 13 个主题和 17 个卫星传感器。使用 Google 地球引擎 API 作为工具,大语言模型代理只能实现 33% 的准确率,因为代码无法运行超过 58% 的情况。通过对合成数据进行微调,我们提高了开源模型的故障率,这使得较小的模型(如 Llama-3.1-8B)能够达到与大型模型(如 DeepSeek-R1)相当的准确性。总之,我们的研究成果指出了 AI 代理在自动化地球观测之前需要解决的重要挑战,并提出了前进的道路。该项目页面可在 https://iandrover.github.io/UnivEarth 查看。