罗汉果全基因组Survey分析
Genome survey analysis in Siraitia grosvenorii作者机构:湖南农业大学园艺园林学院长沙410128 广西药用植物园南宁530023 中国医学科学院药用植物研究所北京100193
出 版 物:《广西植物》 (Guihaia)
年 卷 期:2015年第35卷第6期
页 面:786-791页
学科分类:0710[理学-生物学] 07[理学] 09[农学] 071007[理学-遗传学] 0901[农学-作物学] 090102[农学-作物遗传育种]
基 金:国家自然科学基金(81373914,31400275) 国家科技支撑计划项目(2011BAI01B03) 广西农业科技成果转化项目(桂科转1123013-12) 广西自然科学基金(2013GXNSFBA019170) 湖南省科技计划重点项目(2014SK2005) 广西卫生厅中医药科技专项(GZPT1235)
主 题:罗汉果 基因组测序 杂合率 GC含量 鸟枪法测序策略
摘 要:罗汉果是广西特有药用及甜料植物,其主要成分之一甜苷V作为天然、非糖甜味剂,具有广阔的开发前景,但罗汉果目前完全来自于栽培,适生区狭窄,连作障碍严重,加之含量低导致甜苷V生产成本居高不下,严重限制了其应用。为了减少盲目性,在大规模全基因组深度测序之前,先做低覆盖度的基因组Survey测序,评价基因组的大小及复杂程度,以确定适合该植物全基因组的测序研究策略。该研究采用第二代高通量测序技术(Illumina Hiseq TM 2000)首次测定了罗汉果基因组大小,并利用生物信息学方法估计罗汉果杂合率、重复序列和GC含量等基因组信息。结果表明:(1)获得了18.1 Gb罗汉果基因组测序数据,基因组大小估计为344.95 Mb左右,测序深度为52×;(2)从K-mer分布曲线发现罗汉果基因组有明显的杂合峰,杂合率达1.5%,基因组高杂合导致组装的结果中Contig N50和Scaffold N50的长度比预期的要短很多,还造成GC平均深度及含量分布明显异常,存在一个低深度分布区域。基因组主峰后面有微弱的重复峰,说明罗汉果存在较多的重复序列;(3)由于罗汉果存在高杂合率和重复序列较多的特点,该基因组测序分析仅采用全基因组鸟枪法(WGS)策略不合适,为了更好地对全基因组进行序列拼接和组装,可尝试结合采用Fosmid-to-Fosmid或BAC-to-BAC策略。该研究结果对于揭示罗汉果产量、有效成分含量、发育及抗病虫的分子机制,以及通过分子育种来提高甜苷V含量和降低生产成本具有重要意义,为全基因组测序策略的选择提供了依据。