咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Bootstrap方法最大熵优化过采样算法 收藏

基于Bootstrap方法最大熵优化过采样算法

An Over⁃Sampling Algorithm for Maximum Entropy Optimization Based on Boot⁃strap Method

作     者:雷天纲 陈刚 LEI Tiangang;CHEN Gang

作者机构:大连海事大学理学院大连116026 

出 版 物:《数据采集与处理》 (Journal of Data Acquisition and Processing)

年 卷 期:2023年第38卷第3期

页      面:727-740页

学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(11571056) 

主  题:非平衡数据 自助法 最大熵原理 概率增强 分类 

摘      要:随着数据时代的到来,非平衡数据的分类问题受到越来越多的关注。在非平衡数据的分类问题中,往往因为少数类样本与多数类样本比例失衡而导致分类结果错误。因此,提出了一种在最大熵原理下基于自助法(Bootstrap method)的过采样算法。首先,通过自助法获得数据样本的概率分布,并用最大熵原理对概率分布进行优化;其次,根据少数类生成新的少数类的能力不同,提出基于少数类样本分布的概率增强算法。该算法使数据随机性得到了充分体现,保证了少数类样本的概率密度在数据集平衡前后保持一致性,从而提高分类算法的有效性;最后,通过从UCI和KEEL数据库选取8组数据进行实验,实验结果表明所提出的新算法比现有的其他算法更有效。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分