咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合知识组织体系的层次化主题挖掘方法研究 收藏

融合知识组织体系的层次化主题挖掘方法研究

作     者:于诗睿 李爱花 杨雪梅 李晓瑛 陈逸菲 唐小利 

作者机构:中国医学科学院医学信息研究所 

出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)

年 卷 期:2024年

核心收录:

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:中国医学科学院医学与健康科技创新工程2021年重大协同创新项目“生物医学文献信息保障与集成服务平台”(编号:2021-I2M-1-033)的研究成果之一 

主  题:层次主题模型 知识组织体系 主题挖掘 自然语言处理 文本聚类 

摘      要:[目的] 识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。[方法]将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数据及知识组织体系进行分析。[结果]实现了清晰的主题分层分类,其中PubMedBERT+SK模型的综合性能最优,NPMI,CV,WEPS和WERBO指标分别为0.069,0.617,0.988和0.989,PubMedBERT+KM模型的NPMI指标最优,NPMI, CV,WEPS和WERBO指标分别为0.118,0.570,0.890和0.976。[局限] 医学主题词表层级结构构建的目的与主题识别分层的需求有所不同,导致对领域主题内容的理解与实际有所出入,分层效果欠佳。[结论] 提出的融合知识组织体系的层次化主题挖掘方法通过对主题分层分类,改善主题识别结果的质量。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分