面向类不平衡数据集的即时软件缺陷预测方法研究文献综述

 2021-10-19 22:34:54

毕业论文课题相关文献综述

软件缺陷预测一直是软件工程研究中最活跃的领域之一,减少软件缺陷的数量(及其高调试成本)是一个具有挑战性的问题,特别是考虑到软件团队的测试资源有限,并且经常面临快速交付的强大压力。

因此,已经提出了机器学习方法来预测软件源代码中的缺陷。

这种软件缺陷预测(Software Defect Prediction, SDP)方法有助于更容易地分配测试资源和检查工作,将更多的注意力集中在可能包含缺陷的软件组件上。

即时软件缺陷预测(Just-in-time Software Defect Prediction, JIT-SDP)是一种软件变更级的缺陷预测方法,旨在于开发者提交代码时,对其引入的代码是否存在缺陷进行预测。

由于开发者刚结束开发,所以对于代码的即时检查要比后期检查容易的多,这是优于传统的软件测试方法的。

所以JIT-SDP引起了业界的广泛关注。

然而JIT-SDP的大多数现有方法都假设过去导致缺陷的软件变更与未来的相似,但是导致缺陷的软件变更的特征实际上是随着软件的生命周期波动的,这些波动会对在旧数据上训练的分类器性能产生负面的影响,解决这个问题就需要机器学习算法不仅能够考虑时序,而且能够随着时间的推移学习和适应。

随着时间的推移,可以单独学习新训练示例的算法通常被称为在线学习算法。

JIT-SDP还可能受到类不平衡的影响,随着时间的推移,问题的不平衡状态可能会增加或减少,相比于正确的软件变更,导致缺陷的软件变更通常是少数,然而现有的JIT-SDP方法都假设类不平衡状态是静态的,即不会随着时间推移而改变,所以很可能随着时间的推移而表现不佳。

即使是仅使用最近的数据重建分类器的方法,也难以获得良好的预测性能,尽管能够追踪类不平衡程度,但这是以丢弃旧的训练示例为代价的,这些示例对于学习少数类可能至关重要。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。