不同缺失率下的数据填补算法稳定性研究
Research on Stability of Data Filling Algorithms With Different Miss Rates作者机构:贵州民族大学数据科学与信息工程学院贵阳550025
出 版 物:《统计与决策》 (Statistics & Decision)
年 卷 期:2023年第39卷第8期
页 面:12-17页
核心收录:
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
基 金:贵州省科技计划项目(黔科合基础-ZK一般340) 贵州民族大学“部校共建”专项项目(GZMDBXSZM1908)
摘 要:为了研究数据缺失填补算法的准确性和稳定性,文章基于完全随机缺失对完整数据集按不同缺失率进行挖空处理,然后使用6种算法对缺失数据进行填补,并重复执行多次,对比分析其准确性和稳定性,给出相应的置信区间。结果表明,混合迭代填补法准确性优于K近邻、缺失森林、加权K近邻等算法,其稳定性仅次于缺失森林;随着缺失率的增大,该算法准确性高的优势更加显著;当缺失率小于5%时,该算法的准确性和稳定性达到最佳。