基于最大平衡度的自适应随机抽样算法
Adaptive Random Sampling Algorithm Based on the Balance Maximization作者机构:吉林大学计算机科学与技术学院吉林长春130012 东北师范大学计算机科学与信息技术学院吉林长春130117
出 版 物:《东北大学学报(自然科学版)》 (Journal of Northeastern University(Natural Science))
年 卷 期:2018年第39卷第6期
页 面:792-796页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:非平衡数据集 最大平衡度 随机抽样 随机森林 数据预处理
摘 要:针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基于最大平衡度的自适应随机抽样算法,进一步优化了随机森林算法的分类效果.将其应用在随机森林算法的数据预处理阶段,并通过实验证明了该随机抽样方法的有效性,在合理的整体精度范围内能够较好地处理非平衡数据.产生的新数据比较拟合初始数据,能够提高分类器处理非平衡数据的能力.