摘要
arXiv:2504.15972v1 类型: cross
摘要:本研究探索了一种新颖的方法,利用Eclipse项目中的Bugzilla数据来预测关键的Bug相关结果,包括解决时间、修复时间和最终状态。具体来说,我们利用在Bug解决之前可用的特征来提高预测准确性。我们的方法结合了情感分析,从中提取出情绪得分和情感分类(正面或负面)。此外,我们还整合了使用BERTopic模型提取的Bug优先级和主题,作为卷积神经网络(CNN)和多层感知机(MLP)的特征。我们的研究表明,BERTopic和情感分析的结合可以提高某些模型性能指标。此外,我们观察到,平衡模型输入可以增强其实用性,但通常会导致准确性显著降低。为了实现我们的主要目标——预测解决时间、修复时间和Bug命运,我们采用了二分类和精确时间值预测两种方法,允许对这两种预测有效性进行比较评估。结果表明,情感分析在预测Bug最终结果方面具有重要作用,尤其是在判断它是否会得到修复时。然而,当对Bug进行更复杂或非传统的结果类别分类时,其效用就不那么明显了。