LLM2D

摘要

arXiv:2502.01825v1 宣告类型: cross 摘要: 数据扩充已经成为软件工程中处理数据集有限或不平衡的标准做法，特别是在测试分类和漏洞检测等专门领域，这些领域的数据可能较少。尽管在软件测试和调试应用程序中广泛使用了诸如SMOTE和基于变异的扩充等技术，但关于扩充后的训练数据如何影响模型偏差的理解还不够严谨。在使用扩充数据集不仅用于训练，还用于测试模型的情况下，考虑偏差尤为重要。通过对脆弱测试分类的全面案例研究，我们展示了如何测试偏差以及在测试集中包含扩充样本如何影响模型评估的理解。