基于多源数据的中文产科知识图谱构建
Construction of Chinese Obstetric Knowledge Graph Based on Multiple Source Data作者机构:郑州大学信息工程学院河南郑州450001 郑州中业科技股份有限公司河南郑州450001 郑州大学第三附属医院河南郑州450052 郑州大学外国语与国际关系学院河南郑州450001
出 版 物:《郑州大学学报(理学版)》 (Journal of Zhengzhou University:Natural Science Edition)
年 卷 期:2023年第55卷第1期
页 面:8-14页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划项目(2017YFB1002101) 国家社科基金重大项目(17ZDA138) 国家自然科学基金项目(62006211) 河南省科技攻关项目(192102210260)
摘 要:以产科专业叙词表、临床路径和诊疗规范等为数据来源构建了中文产科知识图谱(Chinese obstetric knowledge graph,COKG)。以产科疾病为核心,依据术语标准及已有主题词表,确立了概念分类体系及关系描述体系,形成了COKG模式层;在Bi-LSTM-CRF和PCNN模型的基础上,通过医学专家的指导对多来源的200余万字非结构化文本进行人工校对,并对多源数据进行知识融合,形成了COKG数据层。所构建的COKG包括2343种疾病、15249个实体关系,可以为医疗问答系统和智能辅助诊疗等应用提供结构化的知识支持。