摘要
arXiv:2504.16485v1 宣布类型: 横向
摘要: AI 代码生成工具在开发人员中获得了显著的流行,他们利用这些工具来协助软件开发,因为这些工具能够生成代码。现有研究主要探讨了 AI 生成代码的质量,如正确性和安全性,而在实际软件开发中,先决条件是区分 AI 生成代码和由人工编写的代码,这强调了开发人员明确声明 AI 生成代码的必要性。为此,本研究旨在了解开发人员如何自我声明 AI 生成代码,并探讨开发人员选择声明或不声明的原因。我们进行了一个混合方法研究,分为两个阶段。在第一阶段,我们挖掘了 GitHub 仓库,并收集了 613 个 AI 生成代码片段。在第二阶段,我们进行了后续的工业调查,收到了 111 份有效回复。我们的研究揭示了开发人员自我声明 AI 生成代码的做法。大多数实践者(76.6%)总是或有时会自我声明 AI 生成代码。相比之下,其他实践者(23.4%)表示他们从不自我声明 AI 生成代码。自我声明 AI 生成代码的原因包括跟踪和监控代码以便在未来进行审核和调试,以及道德考虑。不自我声明 AI 生成代码的原因包括对 AI 生成代码进行大量修改,以及开发人员认为自我声明是一项不必要的活动。最后,我们为实践者提供了关于如何自我声明 AI 生成代码的指南,以解决伦理和代码质量方面的关切。