基于概率分布估计的混合采样算法
Hybrid sampling algorithm based on probability distribution estimation作者机构:东北大学信息科学与工程学院沈阳110004 东北大学医学影像计算教育部重点实验室沈阳110004
出 版 物:《控制与决策》 (Control and Decision)
年 卷 期:2014年第29卷第5期
页 面:815-820页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 0802[工学-机械工程] 080201[工学-机械制造及其自动化]
基 金:国家自然科学基金项目(61001047) 中央高校基本科研业务费专项资金项目(N110618001)
摘 要:在类别不均衡的数据中,类间和类内不均衡性问题都是导致分类性能下降的重要因素.为了提高不均衡数据集下分类算法的性能,提出一种基于概率分布估计的混合采样算法.该算法依据数据概率分别对每个子类进行采样以保证类内的均衡性;并扩大少数类的潜在决策域和减少多数类的冗余信息,从而同时从全局和局部两个角度改善数据的平衡性.实验结果表明,该算法提高了传统分类算法在不均衡数据下的分类性能.