猩红热发病率与气象因素之间的多项式模型拟合研究
作者单位:安徽医科大学
学位级别:硕士
导师姓名:王静
授予年度:2014年
学科分类:1004[医学-公共卫生与预防医学(可授医学、理学学位)] 100401[医学-流行病与卫生统计学] 10[医学]
主 题:猩红热 气象因素 Mathematica数学软件 多变量多项式模型 负二项回归
摘 要:背景 猩红热是法定的乙类传染病,主要经空气、飞沫、粉尘等由呼吸道直接传播,人类是猩红热的唯一宿主,人群普遍易感,患者和带菌者均可能为其主要的传染源。疾病的发生不仅与病菌的性质、患者的性别、年龄和机体免疫状况等因素有关,还与气象因素有一定的关系。研究表明,气象因素与疾病的发病率之间存在关联,但是他们之间的关联的方式与还需要做进一步的探讨。疾病的发病率与气象因素之间的关系是极其复杂的,气象因素对发病率的影响是多方面的,不可能是简单的线性关系或者单一的曲线模型,应该是复杂的曲线关系,因此我们引入非线性的多变量多项式模型来拟合猩红热发病率与气象因素之间的关系,可以提高仿真精度和拟合精度,能充分的利用变量的信息,具有更好的理论和实践意义。利用Mathematica数学软件拟合多项式模型早已应用于很多领域,但是在对猩红热发病率和气象因素间的拟合在国内外却鲜有报道。 目的 本文将对猩红热的发病率和气象因素的数据利用Mthematica7.0数学软件和Stata11.0拟合多变量多项式和负二项回归模型,然后运用相对误差平方和、均方差指标、决定系数和调整后决定系数等指标,对我们的拟合结果做一下分析,并且与多元线性回归和负二项回归做一下比较,检测我们预测模型的好坏,然后根据拟合的结果选择最优的拟合方程。 资料和方法 1985-2006年猩红热每月的发病人数和总人口数资料以及气月平均降水量、月平均气压、月平均气温、月平均相对湿度和月平均最低气温等5项气象资料的数据均有安徽省某市的疾病预防控制中心提供。Excel2007和SPSS17.0建立1985-2006年每月猩红热患病人数、历年总人数和气象因素资料的数据库。运用SPSS17.0做一般的描述性分析和单因素分相关性分析,选择有意义的气象因素纳入模型。运用Mathematica7.0数学软件的Fit[]函数来拟合多变量多项式模型,其中当幂次是1时,即为多元线性回归模型,运用Stata11.0拟合负二项回归模型,计算拟合的结果,最后利用相对误差平方和、均方差指标、决定系数和调整后决定系数来评价模型的效果,选择最优的拟合方程。在疾病的预测上,我们选取1985-2000年猩红热和气象因素用Mthematica数学软件和Stata建立模型,分别来预测2001-2006年的猩红热的发病率。 结果 一共发现猩红热病例1639例。猩红热月发病率的的中位数是1.15(/100万),每年的与发病率基本上存在4-6月份和11-1月份两个发病高峰期,表现出一定的季节性。猩红热月发病率可能与平均气温、平均相对湿度和最低气温可能有统计学关联,把这三个变量纳入要拟合的模型,通过Mathematica7.0数学软件和Stata11.0以年为单位分析每一年的模型的拟合方程。通过相关的统计学指标发现,多元多项式模型的拟合效果优于多元线性回归模型和负二项回归模型。在最优的方程的选择中,综合考虑我们选择了三次方或者四次方的多变量多项式方程。在疾病的预测上,用Mthematica数学软件拟合的三次方的方程优于其他的拟合方程。 结论 安徽省某市猩红热的发病具有明显的季节性。运用Mathematica数学软件来拟合和预测猩红热发病率多变量多项式模型的效果优于线性回归和负二项回归,为以后疾病的拟合和预测提供一种可能。