LLM2D
自承技术债务检测方法:十年系统回顾
Self-Admitted Technical Debt Detection Approaches: A Decade Systematic Review
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2312.15020v3

摘要

技术债务(TD)代表了在软件开发中与次优设计或代码决策相关的长期成本,这些决策通常是为了满足短期交付目标而做出的。自承技术债务(SATD)发生在开发人员在代码库中明确承认这些权衡时,通常通过注释或标注的方式。随着自然语言处理(NLP)、机器学习(ML)和深度学习(DL)技术的发展,自动检测SATD已成为一个日益重要的研究领域。 本系统文献综述提供了对2014年至2024年间发表的SATD检测方法的综合分析,重点关注从基于NLP的模型到更先进的ML、DL和基于Transformers的模型(如BERT)技术的演变。该综述识别了SATD检测方法和工具的关键趋势,使用如精确度、召回率和F1得分等指标评估了不同方法的有效性,并突出了该领域的主要挑战,包括数据集异质性、模型的通用性和模型的可解释性。 研究结果表明,尽管早期的NLP方法为SATD检测奠定了基础,但最近在DL和Transformers模型方面的进展显著提高了检测的准确性。然而,在将这些模型扩展到更广泛的工业应用中仍存在挑战。这篇系统文献综述提供了对当前研究空白的洞察,并为未来工作提供了方向,旨在提高SATD检测工具的鲁棒性和实用性。