部分决策树在软件缺陷预测中的应用
Application of Partial Decision Tree in Software Defect Prediction作者机构:湖南省农村信用社联合社信息科技部湖南长沙410000
出 版 物:《软件导刊》 (Software Guide)
年 卷 期:2020年第19卷第3期
页 面:182-185页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:软件缺陷预测 部分决策树 特征属性选择 随机森林分类算法
摘 要:由于多个特征属性的存在以及属性间存在关联和冗余等因素,导致软件缺陷预测方法计算量较大,且降低了模型预测性能。因此,提出一种基于部分决策树(PART)的特征属性选择算法,使用PART作为特征属性选择的评价准则,然后采用SMOTE方法使数据集达到平衡后,运用回溯爬山算法搜索属性集子空间,找到最优属性子集,最后采用随机森林分类算法预测结果。通过在NASA MDP基础数据集上进行实验,并与基于相关性关系、主成分分析(PCA)两种特征属性选择方法进行比较,得出新方法在分类预测中的准确率比相关性分析方法高出1%~11%,比主成分分析方法高出3%~19%。所以该方法不仅能够有效选取特征属性子集,而且显著提高了分类预测精度及效率。