LLM2D

摘要

技术债务（TD）代表了在软件开发中与次优设计或代码决策相关的长期成本，这些决策通常是为了满足短期交付目标而做出的。自承技术债务（SATD）发生在开发人员在代码库中明确承认这些权衡时，通常通过注释或标注的方式。随着自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术的发展，自动检测SATD已成为一个日益重要的研究领域。本系统文献综述提供了对2014年至2024年间发表的SATD检测方法的综合分析，重点关注从基于NLP的模型到更先进的ML、DL和基于Transformers的模型（如BERT）技术的演变。该综述识别了SATD检测方法和工具的关键趋势，使用如精确度、召回率和F1得分等指标评估了不同方法的有效性，并突出了该领域的主要挑战，包括数据集异质性、模型的通用性和模型的可解释性。研究结果表明，尽管早期的NLP方法为SATD检测奠定了基础，但最近在DL和Transformers模型方面的进展显著提高了检测的准确性。然而，在将这些模型扩展到更广泛的工业应用中仍存在挑战。这篇系统文献综述提供了对当前研究空白的洞察，并为未来工作提供了方向，旨在提高SATD检测工具的鲁棒性和实用性。