东南沿海地区部分省份新型冠状病毒肺炎早期流行病学特征及其与百度搜索指数关联性研究
作者单位:中国医科大学
学位级别:硕士
导师姓名:关鹏
授予年度:2022年
学科分类:1004[医学-公共卫生与预防医学(可授医学、理学学位)] 1002[医学-临床医学] 100201[医学-内科学(含:心血管病、血液病、呼吸系病、消化系病、内分泌与代谢病、肾病、风湿病、传染病)] 100401[医学-流行病与卫生统计学] 10[医学]
主 题:新型冠状病毒肺炎 东南沿海地区 百度搜索指数 分布滞后非线性模型
摘 要:目的:1.分析东南沿海地区部分省份新型冠状病毒肺炎(简称“新冠肺炎)早期流行病学特征;2.分析东南沿海地区部分省份新冠肺炎每日新增确诊病例数(简称“日新增病例数)与关键词百度搜索指数的相关关系;3.构建分布滞后非线性模型分析百度搜索指数对新冠肺炎日新增病例数影响的滞后效应。方法:在江苏省、浙江省、上海市、广东省和广西壮族自治区卫生健康委员会官方网站收集2020年1月19日至2020年2月29日的新冠肺炎日新增病例数和具体病例信息。使用Excel 2010整理各省新冠肺炎的流行曲线以及病例的年龄、性别、症状和湖北旅居史等信息。通过站长之家(https://***/baidu/***)进行关键词挖掘,挖掘出与“新型冠状病毒相关的前100个相关词。按新型冠状病毒的定义、疫情信息、预防、症状、治疗和其他特征进行分类确定最终关键词,通过百度搜索指数官方网站(https://***)收集这些关键词2020年1月19日至2020年2月29日的百度搜索指数。将百度搜索指数与新冠肺炎新增病例进行Spearman秩相关性分析,将其中具有先行性的关键词建立分布滞后非线性模型,分析当前关键词搜索量对新冠肺炎新增确诊病例影响的滞后性。Spearman秩相关法分析采用SPSS 22.0软件,分布滞后非线性模型使用R 3.5.2中DLNM包进行。结果:1.本文所研究的东南沿海地区部分省份新冠肺炎流行趋势整体呈现暴发流行模式,2月底呈零星散发状态。男女性别比接近,各个年龄段均有发病,其中除广东省新冠肺炎确诊病例中50~59岁年龄段占比最高外,其他四个省30~39岁的人群占比最高。主要症状为发热、咳嗽咳痰、乏力、畏寒和胸闷气促等。确诊病例中有无湖北旅居情况分析结果显示,前期新增确诊病例主要为湖北省输入病例,后期无湖北旅居史病例的比例增大。2.相关性分析结果显示,选定的37个搜索关键词中江苏省有29个关键词具有统计学意义(P0.05或P0.01),其中相关关系最显著的关键词为“新型冠状病毒的特征“新型冠状病毒名称“新型冠状病毒肺炎疫情“新型冠状病毒实时动态“新型冠状病毒人数,相关系数为0.873~0.896。浙江省有31个关键词具有统计学意义(P0.05或P0.01),其中相关关系最显著的关键词为“新型冠状病毒名称“新型冠状病毒潜伏期“新型冠状病毒的特征“新型冠状病毒病例“新型冠状病毒怎么引起的,相关系数为0.867~0.913。上海市有28个关键词具有统计学意义(P0.05或P0.01),其中相关关系最显著的关键词为“新型冠状病毒名称“新型冠状病毒传染途径“新型冠状病毒病例“新型冠状病毒的特征“新型冠状病毒潜伏期,相关系数为0.844~0.882。广东省有32个关键词具有统计学意义(P0.05或P0.01),其中相关关系最显著的关键词为“新型冠状病毒的特征“新型冠状病毒名称“新型冠状病毒病例“新型冠状病毒人数“新型冠状病毒实时动态,相关系数为0.873~0.933。广西壮族自治区有31个关键词具有统计学意义(P0.05或P0.01),其中相关关系最显著的关键词为“新型冠状病毒名称“新型冠状病毒潜伏期“新型冠状病毒的特征“新型冠状病毒传播途径“新型冠状病毒怎么引起的,相关系数为0.850~0.881。3.分布滞后非线性模型结果显示,各省的新冠肺炎相对危险度随着关键词百度搜索指数和滞后天数的变化而变化,并且在相应的滞后天数内其发病风险均较高,提示当这些关键词处于较高水平时,各省在未来几天内发病风险可能会呈现上升趋势。结论:1.2020年1月19日至2020年2月29日东南沿海地区部分省份新冠肺炎流行趋势整体呈暴发流行模式,男女性别比接近,各个年龄段均有发病,发病症状主要为发热、咳嗽咳痰、乏力、畏寒、胸闷气促等,前期以湖北输入性病例为主,后期无湖北旅居史的病例比例增大。2.各省新冠肺炎发病风险与百度搜索指数显著相关,利用百度搜索关键词对新冠肺炎进行监测是可行的。3.分布滞后非线性模型结果显示关键词检索指数能为新冠肺炎发病风险提供至少1~2天的预警。