咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中国替代计量数据的来源与识别研究 收藏

中国替代计量数据的来源与识别研究

Study of the Source and Identification of Chinese Altmetrics Data

作     者:余厚强 马超 王玥 李龙飞 Yu Houqiang

作者机构:中山大学信息管理学院广东广州510006 南京理工大学经济管理学院江苏南京210094 

出 版 物:《情报理论与实践》 (Information Studies:Theory & Application)

年 卷 期:2022年第45卷第12期

页      面:111-118页

核心收录:

学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120501[管理学-图书馆学] 120502[管理学-情报学] 

基  金:国家自然科学基金面上项目“中国替代计量的数据识别机制与关键分析方法研究”(项目编号:72274227) 教育部人文社会科学研究规划基金项目“融合替代计量分析的高校科研社会影响力评价研究”(项目编号:22YJA870016)的成果之一 

主  题:替代计量学 替代计量数据 替代计量数据源 实体识别 正则表达式 

摘      要:[目的/意义]从不同来源的文本中识别和提取学术论文寻找合适的方法,为后续开展国内替代计量研究提供参考。[方法/过程]基于广泛的数据收集,总结归纳中国替代数据来源类别,提出从中国替代计量数据来源中识别学术论文的思路,探究将命名实体识别的方法引入识别和提取学术论文上的可能性,并利用基于正则表达式的识别方法进行实证分析。[结果/结论]中国替代计量数据源种类繁多,包括知识共享平台、学术社交平台、大众社交平台、新闻平台、学科交流平台和视频网站。学术论文提及作为一类新型的命名实体,可参考传统的命名实体识别方法进行识别和提取。实证研究显示,基于正则表达式的方法可以用于学术论文的识别,在知乎“机器学习话题的数据集上取得了80%的F1值,而正则表达式模板的匹配度对识别效果起关键性作用。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分