摘要
arXiv:2504.20612v1 Announce Type: cross
摘要:大型语言模型(LLMs)的迅速发展提高了软件开发过程的效率,减少了编程所需的时间和努力,提升了开发人员的生产力。然而,尽管它们具有潜在的好处,研究表明在受控环境中由LLMs生成的代码会产生不安全的代码,这引发了对其在实际应用中可靠性和安全性的重要关切。本文使用预定义的安全参数来评估多个模型,如ChatGPT、DeepSeek、Claude、Gemini和Grok生成的代码的安全合规性。分析表明,这些代码在身份验证机制、会话管理、输入验证和HTTP安全标头方面存在严重漏洞。虽然一些模型在一定程度上实施了安全措施,但没有一个完全符合行业最佳实践,突显了自动化软件开发所伴随的风险。我们的研究结果强调,人类专业知识对于确保安全软件的部署或审查由LLMs生成的代码至关重要。此外,需要建立稳健的安全评估框架,以增强LLMs生成的代码在实际应用中的可靠性。