知识图谱驱动的人类蛋白质组知识注释与知识探索研究
Knowledge Graph Powered Human Proteome Knowledge Annotation and Knowledge Exploration Study作者机构:中国医学科学院基础医学研究所北京协和医学院基础学院北京100005
出 版 物:《中国生物医学工程学报》 (Chinese Journal of Biomedical Engineering)
年 卷 期:2024年第43卷第3期
页 面:315-326页
核心收录:
学科分类:0831[工学-生物医学工程(可授工学、理学、医学学位)] 08[工学] 0836[工学-生物工程]
基 金:中国医学科学院医学与健康科技创新工程项目(2021-I2M-1-057)
摘 要:蛋白质组知识注释能够帮助科研人员从已有知识中凝练出重要的科学假说,传统的蛋白质组知识注释知识单一且多为简单的知识检索和罗列汇总,知识的综合性和系统性不足。为此,本研究展开知识图谱驱动的人类蛋白质组知识注释与知识探索研究。综合13种生物医学本体和数据库资源,依托图数据库Neo4j构建知识图谱(BMKG)管理生物医学知识;结合先验知识和中心度等图算法,从多层面多角度设计元路径,制定知识注释方案;实现相似度计算和链接预测算法,执行node2vec图嵌入,为辅助知识探索分析做准备。本研究所得BMKG图谱融合了13种生物医学知识资源,共9种2508348个节点,20种25362594条关系。以肾细胞癌蛋白质组知识注释为例,BMKG的知识注释方案能够从多层面多角度展开注释,实现对其关联的通路、药物和表型等知识的归纳提炼。此外,基于BMKG能够展开药物-疾病关联预测等知识探索研究,疾病知识的聚类结果与Mondo本体结构有很好的一致性。本研究建设了网站提供在线服务,网址:http://***,包括三大应用模块:知识检索、知识注释和知识分析。综上,本研究表明知识图谱能够为人类蛋白质组知识注释研究提供新的见解。