咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于相似性度量的软件缺陷预测训练集推荐 收藏

基于相似性度量的软件缺陷预测训练集推荐

Similarity-Based Training Set Recommendation for Software Defect Prediction

作     者:王朝 于巧 韩惠 WANG Chao;YU Qiao;HAN Hui

作者机构:江苏师范大学计算机科学与技术学院江苏徐州221116 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2023年第59卷第9期

页      面:86-94页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61902161) 江苏省高等学校自然科学研究项目(18KJB520016) 江苏师范大学自然科学研究基金项目(17XLR001) 

主  题:软件缺陷预测 训练集选择 跨项目缺陷预测 跨版本缺陷预测 

摘      要:在软件缺陷预测过程中,训练集质量是影响预测结果的关键因素。近几年,训练集选择也成为跨项目缺陷预测和跨版本缺陷预测等场景下的研究热点。然而,现有研究大多针对单一预测场景,可能会在一定程度上影响训练集质量。基于跨项目缺陷预测和跨版本缺陷预测两个场景,从数据分布角度提出一种基于相似性度量的训练集推荐(similarity-based training set recommendation,STSR)方法。采用聚类将候选源项目与目标项目划分为相同个数的簇,计算簇心之间的欧氏距离衡量数据集的相似度,对目标项目进行抽样,计算候选源项目与抽样目标项目缺陷率的差值,并计算干扰类比率,最终实现训练集推荐。在PROMISE数据集的11个项目共40个版本上进行实验验证,采用F1和AUC指标评价STSR方法的性能。实验结果表明,与跨版本缺陷预测相比,STSR方法的F1更优,在AUC指标上两者相当;在时间代价方面,STSR方法的最长推荐时间为5.09 s,是可接受的。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分