咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >全球卫生领域研究热点与主题分析——基于知识图谱和LDA模型 收藏
全球卫生领域研究热点与主题分析——基于知识图谱和LDA模型

全球卫生领域研究热点与主题分析——基于知识图谱和LDA模型

作     者:纪磊 

作者单位:华中科技大学 

学位级别:硕士

导师姓名:刘智勇

授予年度:2019年

学科分类:12[管理学] 1205[管理学-图书情报与档案管理] 10[医学] 

主      题:LDA模型 全球卫生 知识图谱 主题演化 

摘      要:[目的]梳理全球卫生研究发展历史,主题构成,不同时间段热点主题与主题演化过程。比较科学知识图谱理论与LDA模型在科学文献主题探测与主题演化研究中的效果。[方法]研究分别使用知识图谱绘制软件CitesapceⅡ和LDA文本挖掘挖掘工具,基于Python语言的gensim扩展包,对Web of Science数据库下载的题录信息进行分析与图谱绘制,具体方法有:1)利用词频分析法统计1997-2018期间全球卫生的发文量变化,国家发文量,期刊载文量分布;2)运用计量分析及知识图谱软件,对期刊和关键词进行共被引分析,探测全球全球卫生的主题分布和核心期刊分布,对作者进行共现分析,绘制作者网络合作图,发现核心作者群;3)利用LDA主题模型对全球卫生研究进行主题集合构建和主题演化分析。[结果]1)发文量:1997-2018发文量变化呈现典型的幂函数特征,1997-2006为萌芽期,2007-2015为快速增长期,2016-2018发文量进入平稳期甚至略有减少。2)期刊分布:《Lancet》期刊发文量与被引量远高于其他期刊,是全球卫生最权威期刊。除此之外,用期刊发文-被引P-P图将期刊分类为四个区域:核心区,弱势区,潜在热点区,权威区。3)主题分布:LDA主题模型将全球卫生主题分为:传染病防治,精神健康,全球卫生体系能力加强,妇幼保健,烟草与口腔健康,环境健康,健康评估,低收入国家疾病问题,健康公平性。知识图谱构建的主题分布有:动物源性疾病,妇幼健康,全球卫生体系加强,发展中国家卫生问题,非传染疾病与经济问题,疾病风险与健康评估,全球卫生政策与传染病预防,国际卫生合作,全球卫生内涵。4)潜在热点主题:利用LDA主题模型演化和知识图谱关键词突现探测发现的潜在热点主题有:全球健康教育,全球卫生能力加强,国际卫生治理政策与框架,精神健康。5)LDA主题模型构建可以自订聚类主题数目,了解主题内部词项构成,相较于知识图谱研究方法在自由度和评价科学性上具有一定优势。[结论]通过对全球卫生研究的科研文献的知识图谱绘制解读和LDA模型主题分析,获得了全球卫生研究领域的学科演进历史,热点主题分布,作者合作与期刊分布情况,能够为科研研究者研究该领域提供知识基础。通过对比使用LDA主题模型与知识图谱方法,比较了两者的文本处理能力,主题探测效果和主题获取能力,发现了LDA文本挖掘作为知识图谱的补充方法在科研文献计量领域的巨大潜力,验证了LDA模型进行主题挖掘的有效性与科学性,并且结合LDA模型可以有效提高科研文献计量的精度。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分