摘要
arXiv:2504.10412v1 通知类型: 新颖
摘要: 本研究探索了图形神经网络(GNNs)作为代码重构的变革性工具的应用,通过抽象语法树(ASTs)来提升软件可维护性。研究分析了从CodeSearchNet获取的200万个代码片段数据集和一个自定义的GitHub Python文件语料(75000个文件),将GNNs与基于规则的SonarQube和决策树进行了比较。评估指标包括圈复杂度(目标值低于10)、耦合度(目标值低于5)和重构精度。GNNs实现了92%的准确率,减少了35%的复杂度和33%的耦合度,优于SonarQube(78%,16%)和决策树(85%,25%)。预处理修复了60%的语法错误。条形图、表格和AST可视化图清晰地展示了结果。这为更清洁的代码库提供了一条可扩展的人工智能驱动途径,这对于软件工程至关重要。