LLM2D

摘要

arXiv:2504.20612v1 Announce Type: cross 摘要：大型语言模型（LLMs）的迅速发展提高了软件开发过程的效率，减少了编程所需的时间和努力，提升了开发人员的生产力。然而，尽管它们具有潜在的好处，研究表明在受控环境中由LLMs生成的代码会产生不安全的代码，这引发了对其在实际应用中可靠性和安全性的重要关切。本文使用预定义的安全参数来评估多个模型，如ChatGPT、DeepSeek、Claude、Gemini和Grok生成的代码的安全合规性。分析表明，这些代码在身份验证机制、会话管理、输入验证和HTTP安全标头方面存在严重漏洞。虽然一些模型在一定程度上实施了安全措施，但没有一个完全符合行业最佳实践，突显了自动化软件开发所伴随的风险。我们的研究结果强调，人类专业知识对于确保安全软件的部署或审查由LLMs生成的代码至关重要。此外，需要建立稳健的安全评估框架，以增强LLMs生成的代码在实际应用中的可靠性。