基于学术论文全文内容的算法使用行为及其影响力研究
Using Behavior and Influence Assessment of Algorithms Based on Full-text Academic Articles作者机构:南京理工大学经济管理学院信息管理系南京210094 江苏省数据工程与知识服务重点实验室(南京大学)南京210093 江苏省社会公共安全科技协同创新中心南京210094
出 版 物:《情报学报》 (Journal of the China Society for Scientific and Technical Information)
年 卷 期:2018年第37卷第12期
页 面:1175-1187页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120502[管理学-情报学]
基 金:国家社会科学基金重大项目"情报学学科建设与情报工作未来发展路径研究"(17ZDA291)
摘 要:数据挖掘算法已被广泛应用于科学研究与实践中。考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法。本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力。具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估。实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低。本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考。