LLM2D
大型语言模型生成的Web应用程序代码中的隐藏风险:基于安全性评估的代码生成能力评价
The Hidden Risks of LLM-Generated Web Application Code: A Security-Centric Evaluation of Code Generation Capabilities in Large Language Models
作者: Swaroop Dora, Deven Lunkad, Naziya Aslam, S. Venkatesan, Sandeep Kumar Shukla
发布日期: 4/30/2025
arXiv ID: oai:arXiv.org:2504.20612v1

摘要

arXiv:2504.20612v1 Announce Type: cross 摘要:大型语言模型(LLMs)的迅速发展提高了软件开发过程的效率,减少了编程所需的时间和努力,提升了开发人员的生产力。然而,尽管它们具有潜在的好处,研究表明在受控环境中由LLMs生成的代码会产生不安全的代码,这引发了对其在实际应用中可靠性和安全性的重要关切。本文使用预定义的安全参数来评估多个模型,如ChatGPT、DeepSeek、Claude、Gemini和Grok生成的代码的安全合规性。分析表明,这些代码在身份验证机制、会话管理、输入验证和HTTP安全标头方面存在严重漏洞。虽然一些模型在一定程度上实施了安全措施,但没有一个完全符合行业最佳实践,突显了自动化软件开发所伴随的风险。我们的研究结果强调,人类专业知识对于确保安全软件的部署或审查由LLMs生成的代码至关重要。此外,需要建立稳健的安全评估框架,以增强LLMs生成的代码在实际应用中的可靠性。