LLM2D
使用大型语言模型生成文献综述:2699篇出版物中微观物理参数化的用法和系统性偏差
Using large language models to produce literature reviews: Usages and systematic biases of microphysics parametrizations in 2699 publications
作者: Tianhang Zhang, Shengnan Fu, David M. Schultz, Zhonghua Zheng
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.21352v1

摘要

arXiv:2503.21352v1 通知类型: 新 摘要: 大型语言模型为使用计算机进行密集任务提供了机会,实现了以前未曾考虑的科研机会。其中一个机会可能是系统地审查科学文献。在这里,我们展示了如何使用大型语言模型来构建与天气和研究预报(WRF)模型中的微物理参数化相关的2699篇出版物的文献综述,目标是了解它们在模拟降水时的使用方式及其系统偏差。数据库是从Web of Science和Scopus搜索中识别出的出版物构建而成的。使用了大型语言模型GPT-4 Turbo从2699篇出版物的文本中提取有关模型配置和性能的信息。我们的结果揭示了全球范围内九种最受欢迎的微物理参数化方法的使用情况:Lin、Ferrier、WRF单时刻、戈达德积云集合、Morrison、Thompson和WRF双时刻。在2020年之前,更多的研究使用了一时刻参数化;而在2020年之后,使用了两时刻参数化。在这九种参数化中,有七种倾向于高估降水。然而,参数化的系统偏差在不同地区有所不同。除了使用Lin、Ferrier和Goddard参数化模拟在几乎所有地点倾向于低估降水外,其余六种参数化则倾向于高估,尤其是在中国、东南亚、美国西部和中非等地。这种方法可以被其他研究人员用来帮助理解如何通过人工智能的力量利用日益庞大的科学文献来解决他们的研究问题。