基于模糊关联的不平衡数据分类算法研究
Research on imbalance data classification algorithm based on fuzzy correlation作者机构:安徽电子信息职业技术学院软件工程学院安徽蚌埠233030
出 版 物:《齐齐哈尔大学学报(自然科学版)》 (Journal of Qiqihar University(Natural Science Edition))
年 卷 期:2023年第39卷第4期
页 面:21-27页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:安徽省高校自然科学研究重点项目(2022AH053116) 安徽省质量工程项目(2020jyxm0132)。
摘 要:由于信息时代数据量的爆炸式增加,高精度分类海量数据中的稀有种类数据是数据挖掘领域研究的热点。为提升不平衡数据集分类精度,深入研究基于Python的不平衡分类数据模糊关联混合算法,基于不平衡数据爬虫得到不平衡分类数据,采用AdaBoost.M1W集成学习算法训练不平衡数据集,从分类精度、分类器效率和分类器规模3方面进行对比。仿真实验结果表明,所提算法在自然不平衡数据集和人工不平衡数据集都具有较高精度,分类性能较优。