咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >边界与密度适应的SMOTE算法研究 收藏

边界与密度适应的SMOTE算法研究

Research on SMOTE algorithm based on boundary and density adaptation

作     者:梅大成 陈江 郑涛 Mei Dacheng;Chen Jiang;Zheng Tao

作者机构:西南石油大学计算机科学学院 西南石油大学石油工程计算机模拟技术四川省高校重点实验室成都610500 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2022年第39卷第5期

页      面:1478-1482页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:合成少数类过采样 类不平衡 特征边界 密度适应 

摘      要:针对合成少数类过采样技术等基于近邻值的过采样算法在处理数据类不平衡时,不能根据少数类样本分布情况及时调整模型参数,导致过采样后的数据集引入噪声,并且在原始分布区域上无差别地合成少数类实例造成过拟合等问题,提出了一种特征边界和密度适应的SMOTE算法(SMOTE algorithm for feature boundary and density adaptation,BDA-SMOTE)。该算法为每一个少数类样本规划安全区域,增加少数类的分布,同时基于数据的分布密度动态地调整模型参数,确保生成的数据具有明显的特征边界,防止过拟合。在公开数据集KEEL上与常用的SMOTE算法进行实验对比,结果BDA-SMOTE的性能优于其他基于近邻SMOTE算法。表明该算法较好地扩展了原数据集的分布,同时合成的噪声样本更少。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分