咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中文学术论文全文语步识别研究 收藏

中文学术论文全文语步识别研究

Identifying Moves in Full-Text Chinese Academic Papers

作     者:杜新玉 李宁 Du Xinyu;Li Ning

作者机构:北京信息科技大学计算机学院北京100101 

出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)

年 卷 期:2024年第8卷第2期

页      面:74-83页

核心收录:

学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 120502[管理学-情报学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(项目编号:61672105)的研究成果之一 

主  题:学术论文理解 语步识别 预训练模型 

摘      要:【目的】针对学术论文语步识别相关研究存在只能处理少量的语步、语步识别粒度较粗、缺少公开的语步分类数据集等问题,研究学术论文的全文语步识别,为机器自动理解论文内容提供基础。【方法】基于BERT模型,采用多阶段微调的方式构建学术论文语步分类数据集,并提出一种融入章节标题文本的语步识别方法,在细粒度层面实现中文学术论文全文语步的识别。【结果】实验结果表明,学术论文语步的22类别分类任务中,RoBERTa-wwm-ext模型总体准确率提升0.031,达到0.909,Micro-F1值提升0.022,达到0.837。【局限】所构建的学术论文语步分类数据集尚存在少量数据不平衡问题,所提方法受限于论文质量,这些问题得到改进后,模型对语步的识别能力应能得到进一步提高。【结论】所提方法取得了较高的语步识别准确率,研究成果可用于学术论文的自动理解、论文质量评价及论文语义检索等领域,对科技文献的有效利用具有重要作用。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分