摘要
arXiv:2505.08163v1 声明类型: 新
摘要: 邻里环境包括住房质量、道路和人行道等物理和环境条件,这些条件对人类的健康和幸福感有显著影响。传统的评估这些环境的方法,包括实地调查和地理信息系统(GIS),资源密集且在大规模评估邻里环境时具有挑战性。尽管机器学习为自动化分析提供了潜力,但标注训练数据的过程繁琐,以及缺乏可访问的模型阻碍了其可扩展性。本研究探讨了使用大型语言模型(LLMs),如ChatGPT和Gemini,作为工具大规模解码邻里环境(例如,人行道和电力线)的可行性。我们训练了一个基于YOLOv11的稳健模型,在检测包括路灯、人行道、电力线、公寓、单车道道路和多车道道路在内的六种环境指标时,平均准确率达到99.13%。随后,我们评估了包括ChatGPT、Gemini、Claude和Grok在内的四种LLMs,以评估它们在识别这些指标方面的可行性、稳健性和局限性,重点研究了提示策略和微调的影响。我们使用前三名LLM的多数投票实现了超过88%的准确率,这表明LLMs可以作为无需训练努力解码邻里环境的有用工具。