基于高通量测序技术的三叉苦幼苗转录组数据分析
Transcriptomic data analyses of Melicope pteleifolia via Illumina high-throughput sequencing technology作者机构:广州中医药大学中药资源科学与工程研究中心岭南中药资源教育部重点实验室国家中成药工程技术研究中心广东广州510006 华润三九医药股份有限公司广东深圳518002
出 版 物:《中草药》 (Chinese Traditional and Herbal Drugs)
年 卷 期:2020年第51卷第14期
页 面:3777-3784页
核心收录:
学科分类:1008[医学-中药学(可授医学、理学学位)] 1006[医学-中西医结合] 100602[医学-中西医结合临床] 10[医学]
基 金:国家自然科学基金委青年基金项目(81102764) 广东省教育厅重点提升平台建设项目——岭南中药资源教育部重点实验室(2014KTSPT016) 广东省教育厅创新团队项目——中药资源创新团队(2016KCXTD015)
摘 要:目的获得三叉苦Melicope pteleifolia转录组信息特征。方法以三叉苦幼苗根、茎、叶混合样品为对象,采用二代高通量测序平台Illumina HiSeqTM 2000进行转录组测序并进行系统的生物信息学分析。结果转录组测序分析共获得47 045 040条高质量序列(clean reads),Trinity de novo组装获得67 956条unigenes,平均长度787 nt。BLAST分析显示分别有42 749(61.92%)、31 152(45.84%)、26 563(39.0 9%)、17 481(25.72%)条unigenes在NR、Swiss-port、KOG、KEGG数据库得到注释信息,参与生物过程、细胞组分和分子功能3个GO类别的47个小组,共9807条unigenes注释到130个KEGG代谢通路中,筛选到19条次生代谢通路,KOG功能分类分析获得25个不同的KOG功能类群。预测共有高等植物转录因子56个家族;借助MISA软件发现7 748个SSRs,三碱基重复SSRs数量最丰富,有4 117个,出现频率为53.1%,五碱基重复SSRs相对较少,占2.2%。结论利用高通量测序技术和生物信息分析获得三叉苦转录组信息特征,为后续三叉苦功能基因的挖掘、次生代谢途径解析及其调控机制研究奠定基础。