LLM2D

摘要

arXiv:2504.16485v1 宣布类型: 横向摘要: AI 代码生成工具在开发人员中获得了显著的流行，他们利用这些工具来协助软件开发，因为这些工具能够生成代码。现有研究主要探讨了 AI 生成代码的质量，如正确性和安全性，而在实际软件开发中，先决条件是区分 AI 生成代码和由人工编写的代码，这强调了开发人员明确声明 AI 生成代码的必要性。为此，本研究旨在了解开发人员如何自我声明 AI 生成代码，并探讨开发人员选择声明或不声明的原因。我们进行了一个混合方法研究，分为两个阶段。在第一阶段，我们挖掘了 GitHub 仓库，并收集了 613 个 AI 生成代码片段。在第二阶段，我们进行了后续的工业调查，收到了 111 份有效回复。我们的研究揭示了开发人员自我声明 AI 生成代码的做法。大多数实践者（76.6%）总是或有时会自我声明 AI 生成代码。相比之下，其他实践者（23.4%）表示他们从不自我声明 AI 生成代码。自我声明 AI 生成代码的原因包括跟踪和监控代码以便在未来进行审核和调试，以及道德考虑。不自我声明 AI 生成代码的原因包括对 AI 生成代码进行大量修改，以及开发人员认为自我声明是一项不必要的活动。最后，我们为实践者提供了关于如何自我声明 AI 生成代码的指南，以解决伦理和代码质量方面的关切。