基于MCMC方法的区间控制伪装缺失值检测算法
THE INTERVAL CONTROL DISGUISED MISSING VALUE DETECTION ALGORITHM BASED ON MCMC METHOD作者机构:大连海事大学大学信息科学技术学院辽宁大连116026
出 版 物:《计算机应用与软件》 (Computer Applications and Software)
年 卷 期:2022年第39卷第8期
页 面:265-272页
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金青年科学基金项目(61702074) 中央高校基本科研业务费项目(3132019354)。
摘 要:为减少伪装缺失值对数据分析的严重影响,提出基于MCMC方法的区间控制伪装缺失值检测算法。将MCMC方法和基于统计学的离群点检测算法结合在一起进行检测,选取合适的MCMC方法对参数进行取样,根据采样得到的参数,选取合适的基于统计学的离群点检测算法确定控制区间,在控制区间内对数据进行遍历,判断是否为高频率伪装缺失值。实验表明,该算法在公开数据集上的查全率、查准率、F1-Measure取得了较好的改善。