混合效应模型的Bayes局部影响分析
作者单位:东南大学
学位级别:硕士
导师姓名:江其保
授予年度:2006年
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
主 题:纵向数据 混合效应模型 数据删除 影响分析 扰动模式 Bayes局部影响分析 Cook距离
摘 要:在纵向数据分析中,人们常常采用混合效应模型。这些模型被广泛应用于生物、医学、经济、抽样设计和质量控制等领域。关于混合效应模型的统计诊断,研究成果已经很多。然而他们主要是基于频率派的,Bayes派的结果却不多见。因此本文主要考虑混合效应模型的统计诊断问题,尤其是模型的Bayes局部影响分析问题。本文根据纵向数据既包含个体又包含个体不同状态的特点,提出了两种便于合理分析数据的扰动方案,导出了模型在上述各种扰动下效应参数的Bayes局部影响度量。最后,我们用实例说明了本文给出的方法的有效性。具体地说,本文主要工作如下: (1) 第二章我们从频率派的观点出发,对模型进行了统计诊断分析,讨论了模型的杠杆值及数据删除模型,分别给出了单个个体的杠杆矩阵与删除单个个体情形时的Cook距离公式。前人一般只考虑单个观测值的情形。并通过实际数据分析,得出了高杠杆个体与数据删除模型时的强影响个体。同时我们将杠杆值分为两部分,分别讨论了模型固定效应与随机效应的边际杠杆值,得出了两种情形下的高杠杆影响个体。 (2) 我们在第三章采用分层模型思想,导出了效应参数的后验分布,并以这一分布为基础讨论了混合效应模型的Bayes局部影响分析。在扰动方式上,针对纵向数据特点下提出了个体扰动与每次观测扰动,分别用于度量单个观测值与单个个体对效应参数估计的影响,并推导出了相应的强影响个体与强影响观测的度量统计量。 (3) 最后通过实际数据分析,得出在上述各种扰动下的强影响个体与强影响观测。强影响观测结论基本与前人已有的全局影响分析结论一致,但也探测出全局影响分析中所没有发现的观测点。同时也可以看出,强影响个体与强影响观测并不存在着必然联系。某个个体的观测在某种扰动模式下对某种参数的估计来说是强影响观测,并不意味着这个个体在同种扰动下对同种参数的估计而言是强影响个体;反之,某个个体是强影响个体,也不意味着该个体的观测也能被诊断为强影响观测。