基于SPO语义三元组的疾病知识发现
Disease Knowledge Discovery Based on SPO Predications作者机构:中国医学科学院/北京协和医学院医学信息研究所北京100020
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2022年第6卷第1期
页 面:134-144页
核心收录:
学科分类:12[管理学] 1205[管理学-图书情报与档案管理]
基 金:科技创新2030-“新一代人工智能”重大项目课题(项目编号:2019AAA0104901) 国家社会科学基金项目(项目编号:20BTQ062) 中国WHO双年合作项目(项目编号:GJ2-2021-WHOSO-01)的研究成果之一。
摘 要:【目的】对PubMed收录的高证据疾病文献进行挖掘与知识发现,为疾病临床诊疗和日常防控提供借鉴。【方法】利用语义抽取工具SemRep,提出基于SPO语义三元组的疾病知识发现模型,选取糖尿病相关文献对模型进行验证,结合可视化及临床知识进行糖尿病知识发现。【结果】获得糖尿病SPO三元组1 258个,语义关系16个,揭示了糖尿病相关的基因、常见的并发症、检测手段及治疗方式。【局限】数据来源为公开发表的文献,未从知识库、电子病历等真实世界数据发现疾病知识。【结论】验证了基于SPO语义三元组的疾病知识发现模型用于揭示大规模文献中隐含的生物医学知识的可行性,有助于为生物医学科研人员提供潜在的研究假设和思路参考。