LLM2D

摘要

arXiv:2505.08163v1 声明类型: 新摘要: 邻里环境包括住房质量、道路和人行道等物理和环境条件，这些条件对人类的健康和幸福感有显著影响。传统的评估这些环境的方法，包括实地调查和地理信息系统（GIS），资源密集且在大规模评估邻里环境时具有挑战性。尽管机器学习为自动化分析提供了潜力，但标注训练数据的过程繁琐，以及缺乏可访问的模型阻碍了其可扩展性。本研究探讨了使用大型语言模型（LLMs），如ChatGPT和Gemini，作为工具大规模解码邻里环境（例如，人行道和电力线）的可行性。我们训练了一个基于YOLOv11的稳健模型，在检测包括路灯、人行道、电力线、公寓、单车道道路和多车道道路在内的六种环境指标时，平均准确率达到99.13%。随后，我们评估了包括ChatGPT、Gemini、Claude和Grok在内的四种LLMs，以评估它们在识别这些指标方面的可行性、稳健性和局限性，重点研究了提示策略和微调的影响。我们使用前三名LLM的多数投票实现了超过88%的准确率，这表明LLMs可以作为无需训练努力解码邻里环境的有用工具。