咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中药植物基因组综合数据库的构建及中药基因组的注释 收藏
中药植物基因组综合数据库的构建及中药基因组的注释

中药植物基因组综合数据库的构建及中药基因组的注释

作     者:梁定发 

作者单位:贵州医科大学 

学位级别:硕士

导师姓名:叶远浓;胡祖权

授予年度:2023年

学科分类:1008[医学-中药学(可授医学、理学学位)] 10[医学] 

主      题:中草药 基因组 重注释 数据库 

摘      要:目的:应用现代生物信息知识和计算机技术,通过构建以中草药基因组为核心的数据库并将其嵌入辅助分析工具,为中草药研究人员提供基因组相关的数据资源和平台,以促进中药现代化的研究。方法:1.基于NCBI数据库的植物全基因组信息,通过数据处理,提取以下四类分子信息:中药的基因序列、RNA序列、蛋白序列、CDS序列;2.用egg NOG-mapper对所有蛋白序列进行KEGG注释,获得每个蛋白的通路或酶信息等,使本研究所构建的中药基因组数据库实现中药物种内、物种间的分子关联;3.根据现有中药相关数据库,找到中药的活性成分,并通过成分的化学式在KEGG数据库中找寻参与该成分反应的酶分子,从而探寻中药蛋白与中药活性成分的联系;4.利用中药基因组信息和注释信息构建序列相似性分析和基因组浏览工具。利用以上信息构建以中药基因组为核心的在线数据库。结果:通过上述数据库构建方法,对中草药植物基因组数据进行整合分析挖掘,建构数据库IGTCM(IGTCM:An Integrative Genome Database of Traditional Chinese Medicine Plant)。IGTCM数据库包含83种已注释的中草药全基因组,其中27种来自NCBI的Gen Bank数据库,56种来自Ref Seq数据库。中草药基因组数据包括基因序列3,610,350条、蛋白序列和CDS序列各3,534,314条和4,032,242条RNA序列。利用高通量注释工具egg NOG-mapper对所有蛋白进行KEGG注释,分别获得了1677个酶(enzyme)、16519个基因本体(GO)、58个功能层次分类(BRITE)、357个基因集与反应集功能单元(KEGG Module)、5763个同源功能(KEGG Orthology)、830个通路(KEGG Pathway)、2518个生化反应(KEGG Reaction)和909个反应类(KEGG rlass);通过整理可信度高的中草药相关数据库,如HERB、Sym Map v2数据库,得到非冗余中药活性成分1033条,利用其成分的化学式在KEGG化合物数据库中找到相关参与酶共1601个,其中有384个酶存在于IGTCM数据库中,使得中药活性成分与中药基因组存在相关性,弥补了国内外中医药基因组数据库存在的不足。结论:IGTCM数据库提供了一个完整、系统的中药植物基因组综合数据库,让用户可通过关联查询分子信息,探索基因与中草药成分的潜在作用机制,以便药物开发人员识别新的候选化合物。IGTCM数据库通过人工筛选NCBI数据库中的植物基因组,得到用于序列相似性分析的高价值基因组序列,弥补了当前已发表的基因组数据库中TCM-Blast、GPGD等数据库中数据不全面、不丰富的缺陷。此外,中药基因组与中药活性成分的关联为中草药品种的育种、培育和分子鉴定提供了坚实理论依据和高效的技术平台,为中草药有效成分的发现提供了便利。最后,中药基因组数据库实现了最小的互通性,每个基因和成分都使用egg NOG-mapper工具和KEGG数据库进行注释,以获得基因的通路信息和酶分类等,并通过这些特征实现物种内、物种间的联系,从而形成一条对中药基因组解析的完整闭合途径。因而,通过搜索IGTCM可以获得更多有趣的基因细节。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分