基于引文内容挖掘的科技创新路径识别方法与开源工具研究
Research on Technology Innovation Path Recognition Method and Open Source Tool Based on Citation Content Mining作者机构:山东理工大学科技信息研究所山东淄博255049
出 版 物:《现代情报》 (Journal of Modern Information)
年 卷 期:2018年第38卷第7期
页 面:113-121页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120501[管理学-图书馆学] 120502[管理学-情报学]
基 金:教育部人文社会科学研究青年基金项目"基于引文内容分析的科技创新路径识别研究"(项目编号:16YJC870008) 山东省软科学重点研究计划项目"深化高校 科研院所科研体制改革对策研究"(项目编号:2017RZB01046)
主 题:科技创新路径 引文分析 自然语言处理 引文内容挖掘 开源工具
摘 要:[目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、***、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。