咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于间隔理论的过采样集成算法 收藏

基于间隔理论的过采样集成算法

Over sampling ensemble algorithm based on margin theory

作     者:张宗堂 陈喆 戴卫国 ZHANG Zongtang;CHEN Zhe;DAI Weiguo

作者机构:海军潜艇学院航海观通系山东青岛266000 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2019年第39卷第5期

页      面:1364-1367页

学科分类:08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 

主  题:不平衡数据 间隔理论 过采样方法 集成分类器 机器学习 

摘      要:针对传统集成算法不适用于不平衡数据分类的问题,提出基于间隔理论的AdaBoost算法(MOSBoost)。首先通过预训练得到原始样本的间隔;然后依据间隔排序对少类样本进行启发式复制,从而形成新的平衡样本集;最后将平衡样本集输入AdaBoost算法进行训练以得到最终集成分类器。在UCI数据集上进行测试实验,利用F-measure和G-mean两个准则对MOSBoost、AdaBoost、随机过采样AdaBoost(ROSBoost)和随机降采样AdaBoost(RDSBoost)四种算法进行评价。实验结果表明,MOSBoost算法分类性能优于其他三种算法,其中,相对于AdaBoost算法,MOSBoost算法在F-measure和G-mean准则下分别提升了8.4%和6.2%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分