咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >120例河南汉族男性Y染色体全测序及其Y-SNP基因差异度研... 收藏
120例河南汉族男性Y染色体全测序及其Y-SNP基因差异度研究

120例河南汉族男性Y染色体全测序及其Y-SNP基因差异度研究

作     者:卢颀 

作者单位:郑州大学 

学位级别:硕士

导师姓名:曾昭书

授予年度:2021年

学科分类:0710[理学-生物学] 07[理学] 08[工学] 0838[工学-公安技术] 071007[理学-遗传学] 

主      题:第二代测序 Y-SNP单倍型 单倍群 时间分化分析 基因差异 

摘      要:背景和目的人类基因组由核基因组及线粒体基因组组成。其中核基因组由22对常染色体和一对性染色体(X、Y)组成。Y染色体中大约有95%的区段无法与其他染色体配对或重组,被称为非重组Y染色体部分(Non-recombinant Y chromosome,NRY)。由于Y染色体只能由男性父代传递给子代、遵循严格的父系遗传规律,所以Y染色体在人类进化漫长的时间里,不断地积累着父子间偶然发生的遗传突变而往下传递。诸如这些原因,使得Y染色体成为极有研究价值的遗传标记集合,这些遗传标记包括各种长度的卫星DNA,插入—缺失(InDel)位点,以及单核苷酸多态性(SNP)等。由于SNP位点具有广泛分布、易于分型、不存在回复突变等优点,所以其对于人类起源、迁徙、演化等方面的研究具有极高的价值。根据Y-SNP位点信息绘制的Y-DNA单倍群系统进化树(ISOGG Y-DNA Haplogroup Tree,http://***/tree),已成为人类学、群体遗传学等领域进行研究的一个重要内容,对于追踪某一生物检材的起源具有重要参考价值。最近十余年来,第二代测序技术(next generation sequencing,NGS)已经得到了极大的发展。它直接将基因组序列信息详细地展现到人们的面前,越来越体现出高通量、低成本、高速度的优势。尤其在近几年,通过NGS技术发现新SNP遗传标记呈现出爆发式增长,为相关的应用及研究提供了更多可能。本实验通过NGS技术首次对120例河南汉族男性进行全Y染色体测序,并基于所获得的测序数据,对Y-SNP位点信息进行群体遗传学分析及法医学应用评价,以期获得具有法医遗传学应用价值的新兴Y-SNP位点;同时对该批样品的Y-DNA单倍群系统进化树进行绘制,以探究河南汉族男性的演化历史、查明河南汉族男性人群结构的特点,从而为相关法医学应用及有关汉族起源的人类学、遗传学研究提供参考。材料依据知情同意原则选取年龄不小于18周岁、祖籍在河南且三代以内均在河南省内居住、互无血缘关系的汉族男性个体120例。每人取前臂外周血2ml,经枸橼酸钠抗凝剂或EDTA抗凝剂处理,于-80℃冰箱内冷冻保存待用。方法1.使用上海莱枫公司的2ml血液基因组DNA提取试剂盒依次提取该120例河南汉族男性外周血基因组DNA。2.委托郑州大学精准医学中心及上海英莱盾生物技术公司各对60例DNA样本在其二代测序平台上进行Y染色体全序列测序。3.对得到的NGS测序数据,在国家超算郑州中心及郑州大学超级计算平台的Linux集群上按照标准NGS生物信息学分析流程(bwa+samtools)进行质控评估,并按照人参考基因组hg19进行比对。4.提取测序结果中的Y-SNP信息:使用GATK软件参考UCSC的db SNP数据库对120例样本的二代测序结果中所有已知Y-SNP位点进行比对并分型,按照群体遗传学方法对其进行统计分析筛选,并计算其单倍型(haplotype)差异度等指标,评价其法医遗传学应用价值。5.Y-DNA单倍群(haplogroup)分型:使用Y-leaf软件对该120例河南汉族男性样本进行Y-DNA单倍群进化树归类。将比对整理好的bam测序结果文件输入yleaf软件并运行程序,参考Y单倍群进化树得到120例样本的Y-DNA单倍群分析结果,确定每一样本在Y单倍群进化树上的分支归属。并计算各单倍群亚型在河南汉族男性群体中的比例。6.分化时间分析:使用BEAST2软件对120例样本的Y-SNP分型进行分化时间分析,重构Y-SNP在时间标尺上的突变累积过程,尝试分析河南汉族人群的起源与迁徙历史。结果1.60例样本在郑州大学精准医学中心进行二代测序,每一例样品均获得了有效数据:平均深度为15.01×,碱基质量稳定可靠,测序质量较好;60例样本在上海英莱盾生物技术公司进行二代测序,每一例样品均获得了有效数据:平均深度为74.30×,碱基质量稳定可靠,测序质量较好。2.将获得的120例河南汉族男性Y染色体测序数据与db SNP数据库比对共获得71543个已知的Y-SNPs位点,其中二等位SNP位点66290个。3.经过筛选,从120例河南汉族男性Y染色体测序数据中获得分型结果缺失率在5%以下、且野生型基因频率位于0.4-0.6范围之内的二等位SNP位点36个。计算其中35个Y-SNP位点rs374887753、rs79917345、rs76000750、rs13305177、rs76204317、rs935098066、rs113547797、rs12164443、rs370594792、rs1200009271、rs911641840、rs200510226、rs144763445、rs200346965、rs796107181、rs60001530、rs200839143、rs2267801、rs77684578、rs76047574、rs1021199046、rs2527475、rs77081563、rs377448563、rs199777144、rs764534147、rs1179626263、rs879181519、rs925064378、rs6568353、rs73628906、rs9285384、rs369323647、rs74747930的各等位基因在120例样品中的组合类型(即单倍型个数),观察到单倍型119个,计算得到单倍型差异度(haplotype diversity,HD)=0.99986。4.参照ISOGG 2019版Y-DNA Haplogroup Tree,共观察到不同的Y-DNA单倍群78个,发现其构成较为复杂,具有高度的多样性。其中分型为O单倍群的样本103例,占比为85.83%(103/120);其中分型为O1单倍群的样本共25例,占比20.83%;分型为O2单倍群的样本共78例,占比65%;分型为C单倍群的样本共8例,占比6.67%;分型为D单倍群的样本共1例,占比0.83%;分型为N单倍群的样本共6例,占比5%;分型为R单倍群的样本共2例,占比为1.67%。5.使用BEAST2软件进行分化时间估算,得到的系统发育树与yleaf软件得到的Y-DNA单倍群分析结果大致相同,发现其间单倍群分化的爆发时间在距今2000-5000年前左右。结论1.二代测序在对Y染色体进行特异性探针捕获并测序时,在不同测序平台及批次下测序结果的覆盖度及对SNP分型等方面存在一定的差异性,有可能对相关的后续分析过程产生影响。2.通过NGS技术可极大地提升Y-SNPs的获取效率,但由于经由NGS产生的基因组原始测序数据规模庞大,需耗费较大的计算资源进行质控、比对、分型等生物信息学分析操作,这对目前的法医DNA实验室来说有较大的考验。3.经过筛选,获得了35个二基因频率在0.4-0.6的Y-SNP位点,该35个YSNP各等位基因的组合构成了不同的Y-SNP单倍型,在120例样品中观察到不同单倍型119个,表明此种单倍型差异度(HD)值极高,具有良好的法医学应用前景。4.在120例河南汉族男性人群的Y-DNA单倍群分型结果中,共检测到包含C、D、N、O、R等5个主要单倍群的78个分支单倍群,表明河南汉族男性人群结构混杂程度较高,其结构以O单倍群为主要特征的汉族人群为主,占比为85.83%。非O单倍群C、D、N、R单倍群存在但占比小,说明在现代河南汉族男性人群的形成过程中既有一定的多样性来源,也有某几个单倍群的大量贡献,即存在着较为复杂的起源、迁徙及融合的过程。5.根据分化时间分析,可推测为现代河南汉族男性Y单倍群的形成时间主要分布于距今2000-5000年之间,这与考古及史料记载的新石器时代后期及青铜器时代古华夏人口大规模扩张、迁徙及与周边民族相融合等情节大致相符。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分