咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >响应变量缺失下非参数回归插补法的改进及应用 收藏
响应变量缺失下非参数回归插补法的改进及应用

响应变量缺失下非参数回归插补法的改进及应用

作     者:阎亚亚 

作者单位:重庆工商大学 

学位级别:硕士

导师姓名:袁德美

授予年度:2022年

学科分类:02[经济学] 0202[经济学-应用经济学] 

主      题:非参数回归插补 新混合回归函数 插补估计量 渐近正态性 缺失值预测 

摘      要:数据缺失问题普遍存在于各个领域当中,如果直接使用不完整的数据集,对后续统计分析工作质量可能会产生不利影响,因此,缺失数据的处理逐渐成为统计学者的研究热点。常见的缺失数据处理方法有删除法、回归插补法、多重插补法等。删除法可能会损失一些重要信息,多重插补法操作过程复杂,对比之下,回归插补法的适用范围更加广泛。回归插补法又分为参数回归插补法和非参数回归插补法,由于非参数回归插补法不对回归形式做出具体假设,其插补比较稳健。本文旨在应对响应变量随机缺失情形,提出一种改进的非参数回归插补法。传统的非参数回归插补法有核密度插补法,最近邻插补法,逆概率加权插补法等。近年来,已有学者结合最近邻插补法与核密度插补法,提出了具备双稳健性质的凸混合插补法。考虑到核密度回归函数和最近邻回归函数对倾向函数是否连续的敏感程度不同,调整了凸混合回归函数中倾向函数的位置,形成新的混合回归函数。根据新混合回归函数,首先对响应变量缺失下的总体均值构造了(?)、(?)插补估计量,其次用有效样本替换样本容量构造了(?)插补估计量,接着证明了正则条件下这三种新混合插补估计量的渐近正态性,并比较了(?)、(?)、(?)插补估计量与核密度、最近邻、凸混合插补估计量之间的渐近方差。本文通过模拟研究来验证改进的非参数回归插补法的优越性,通过实证应用来说明其应用价值。在模拟研究中,根据平均绝对偏差、均方误差、CCI、ZS、Q五个评价指标对各插补估计量进行评估,模拟结果表明,倾向函数连续,(?)、(?)插补估计量的综合插补效果最优;倾向函数不连续,三种新插补估计量的平均绝对偏差小于核密度插补估计量,均方误差小于最近邻插补估计量。在对帆船的单位排水量剩余阻力进行预测时,从缺失值预测的平均绝对误差来讲,改进的插补法比核密度、最近邻插补法好;从缺失值预测的准确性来讲,改进的插补法最好。在对北京PM2.5总体均值进行估计时,缺失率为13%的情况下,(?)、(?)插补估计量的绝对偏差小于核密度、逆概率加权、凸混合插补估计量;缺失率为42%的情况下,(?)插补估计量的绝对偏差最小。实证应用说明本文所提出的改进的非参数插补法的实用性,可以运用于生活中对响应变量随机缺失情形的处理。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分