贝叶斯时空分位数回归及其应用
作者单位:西南交通大学
学位级别:硕士
导师姓名:郑海涛
授予年度:2021年
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
主 题:贝叶斯 P样条 分位数回归 时空数据 高斯马尔可夫随机场 MCMC
摘 要:传统的线性回归本质上是一种均值回归,它只考虑了协变量对响应变量期望的影响。在实际应用中,数据很少呈现正态分布,亦会出现尖峰厚尾的情况,尤其当数据出现极端情况时,均值回归模型采用的最小二乘估计稳健性较差,且不能全面地反映响应变量与协变量之间的依赖关系。分位数回归对误差项没有很强的限制并且能够精确地反映协变量对响应变量整体分布的影响,不同分位数下的影响通常不一样。现实生活中的数据往往不是简单的线性关系,为了研究连续型解释变量在不同分位数下对响应变量的影响,故采用灵活的非参数形式来进行建模。为了探讨响应分布在不同时空下的分位数变化趋势,将时空效应考虑在模型中,构建半参数时空分位数回归模型。本文采用MCMC算法,假设随机误差项服从非对称拉普拉斯分布(ALD),将P样条——B样条与差分惩罚的组合,应用于分位数回归模型中,从而将协变量的非线性函数表示成基函数的线性组合。这样做利于根据Bayes定理,推导出Gibbs抽样需要的待估参数的边际后验分布。为了增加区域间的光滑性,为参数赋予适当的高斯马尔可夫随机场(GMRF)先验。然后通过模拟研究,验证了模型的稳健性和有效性。最后将模型应用到京津冀地区气象因素对空气质量指数(AQI)的影响关系数据中,探讨了京津冀地区气象因素在不同分位数下对AQI的影响,以及不同分位数下的时空因素影响。