咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于密度峰值聚类的不平衡数据过抽样方法 收藏

基于密度峰值聚类的不平衡数据过抽样方法

Oversampling Method for Imbalanced Data Based on Density Peak Clustering

作     者:张智驹 Zhang Zhiju

作者机构:重庆航天职业技术学院智能信息工程学院重庆400021 

出 版 物:《统计与决策》 (Statistics & Decision)

年 卷 期:2024年第40卷第8期

页      面:11-16页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:不平衡分类 过抽样方法 分类 密度峰值 聚类 

摘      要:大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分