缺失数据下空间平均统计量及最优平均
作者单位:广州大学
学位级别:硕士
导师姓名:崔霞
授予年度:2024年
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 070601[理学-气象学] 0706[理学-大气科学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
摘 要:目前,空间平均在气候科学等领域中得到了广泛的应用,例如空间平均已被用于计算全球或者区域的平均温度或平均降水。空间平均作为描述空间分布的指标之一,是通过赋予空间区域上的点观测不同的权重计算出来的。所以,在对空间平均进行计算时,如何确定权重就显得非常重要。与此同时,在实际应用过程中,受到设备故障、数据输入错误等因素的影响,原始数据中可能会存在缺失值。数据的缺失不仅增加了空间平均权重估计的计算难度,也增加了其统计分析的复杂性。为此,本文考虑了不同缺失机制下的空间平均及其权重估计问题,主要研究内容如下: 本文研究缺失机制分别为随机缺失和非随机缺失的空间平均及其权重估计方法。最优权重通常是最小化偏差、方差或者均方误差得到。在数据缺失情形下,空间平均的期望没有显式表达式。本文做了如下工作:首先,由于空间平均是两个随机变量和的比值,故先通过Delta方法得到其偏差和方差的近似表达。接着,推导出不同缺失机制下,随机变量和的方差、协方差的展开式,将其代入到偏差和方差的近似表达中,从而获得空间平均的偏差和方差公式,并对其来源进行简单分析。最后,利用偏差、方差公式,得到最优权重估计。 在模拟研究中,考虑了数据缺失机制为随机缺失以及非随机缺失两种情况下的空间权重估计问题,通过模拟数据得到空间平均的最优权重。在实证研究中,将本文所得到的随机缺失机制下的理论框架运用到全球海洋氨氧化古菌数据中,估计全球海洋氨氧化古菌空间平均最小偏差权重,得到了氨氧化古菌相对丰度空间平均的最优权重估计。数值模拟和实证分析显示了本文建立的方法具有可行性。