LLM2D

摘要

arXiv:2504.10412v1 通知类型: 新颖摘要: 本研究探索了图形神经网络（GNNs）作为代码重构的变革性工具的应用，通过抽象语法树（ASTs）来提升软件可维护性。研究分析了从CodeSearchNet获取的200万个代码片段数据集和一个自定义的GitHub Python文件语料（75000个文件），将GNNs与基于规则的SonarQube和决策树进行了比较。评估指标包括圈复杂度（目标值低于10）、耦合度（目标值低于5）和重构精度。GNNs实现了92%的准确率，减少了35%的复杂度和33%的耦合度，优于SonarQube（78%，16%）和决策树（85%，25%）。预处理修复了60%的语法错误。条形图、表格和AST可视化图清晰地展示了结果。这为更清洁的代码库提供了一条可扩展的人工智能驱动途径，这对于软件工程至关重要。