LLM2D
PyResBugs: 一种由自然语言驱动的残差Python错误数据集用于故障注入
PyResBugs: A Dataset of Residual Python Bugs for Natural Language-Driven Fault Injection
作者: Domenico Cotroneo, Giuseppe De Rosa, Pietro Liguori
发布日期: 5/12/2025
arXiv ID: oai:arXiv.org:2505.05777v1

摘要

arXiv:2505.05777v1 类型: cross 摘要:本文介绍了PyResBugs,这是一个经过精心收集的残余漏洞数据集,即在传统测试中未被检测到但在生产中后期浮现的缺陷,数据集来源于主要的Python框架。数据集中的每个漏洞都与其相应的无故障(已修复)版本配对,并标注有多层次的自然语言(NL)描述。这些NL描述使自然语言驱动的故障注入成为可能,提供了一种在软件系统中模拟真实世界故障的新方法。通过弥合软件故障注入技术与现实代表性的差距,PyResBugs 为研究人员提供了高质量的资源,推动了Python系统中基于AI的自动化测试的发展。