LLM2D

摘要

基于街景图像的大型语言模型用于地理空间预测：StreetViewLLM框架通过整合大型语言模型、链式思维推理和多模态数据源（包括街景图像、地理坐标和文本数据），提高了地理空间预测的精度和粒度。该方法利用检索增强生成技术，增强了地理信息提取能力，实现了对城市环境的详细分析。该模型已应用于包括香港、东京、新加坡、洛杉矶、纽约、伦敦和巴黎在内的七个全球城市，在预测人口密度、医疗保健可及性、归一化植被指数、建筑高度和不透水地面等城市指标方面表现出优越的性能，并持续优于基准模型。这项研究为将大型语言模型集成到城市分析、城市规划决策、基础设施管理和环境监测中开辟了新的机遇。