基于多标签分类的科技文献学科交叉研究性质识别
Identifying Interdisciplinary Sci-Tech Literature Based on Multi-Label Classification作者机构:中国科学院计算机网络信息中心北京100083 中国科学院大学北京100049
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2023年第7卷第1期
页 面:102-112页
核心收录:
学科分类:08[工学] 081104[工学-模式识别与智能系统] 081203[工学-计算机应用技术] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:中国科学院战略性先导科技专项(项目编号:XDA16021400) 中国科学院青年创新促进会(项目编号:2021166)的研究成果之一 国家自然科学基金重点项目(项目编号:61836013)。
主 题:深度学习 多标签文本分类 学科交叉研究识别 科技文献
摘 要:【目的】识别科技文献的学科交叉研究性质,为挖掘学科交叉前沿问题提供支撑。【方法】将学科领域专家提供的科技文献已有学科标签,与文本分类算法预测的科技文献学科标签相结合,共同识别学科交叉科技文献。【结果】相较于直接基于模型预测,本文提出的识别学科交叉科技文献的方法F1指标从0.23提升到0.45。【局限】模型识别学科交叉研究性质科技文献的召回率指标较低。【结论】通过关注不同学科间科技文献被分类错误的数据,判断科技文献的学科交叉研究性质,是值得进一步关注的研究方向。