咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >用生物信息学和系统基因组学作为解决热带树木进化中复杂问题的工... 收藏
用生物信息学和系统基因组学作为解决热带树木进化中复杂问题的工...

用生物信息学和系统基因组学作为解决热带树木进化中复杂问题的工具

作     者:Armijos Carrion Angelo Damian 

作者单位:广西大学 

学位级别:硕士

导师姓名:Joeri Sergey Strijk

授予年度:2020年

学科分类:07[理学] 0713[理学-生态学] 

主      题:生物信息学 自动化工作流 系统发育学 二代测序 质体 完整叶绿体基因组 

摘      要:叶绿体序列由于其高度保守的性质,已被广泛用作系统发育研究的有用工具。使用二代测序方法(NGS)可以容易地从植物中获得完整的叶绿体基因组,为物种划分和系统学提供了宝贵的数据。此外,这些基因组已经广泛用于农业、进化和生态研究、食品检测等,并且目前它们是遗传序列数据库中保存最多的真核基因组,例如日本DNA数据库(国家遗传学研究所)、EMBL(欧洲生物信息学研究所)和基因银行(国家生物技术信息中心)。考虑到无论是通过NGS法还是在线平台获取这些遗传资源的高度可行性,如今许多高通量测序方法可用来揭示不同生物基因组的详细特征,从而进一步探索适用不同进化研究的的生物信息学流程。然而,许多用以重建质体序列的测序方法和生物信息学方法的快速发展,可能导致在选择最有效的方法和设置的混乱。对完整质体基因组进行大规模测序的趋势,凸显对标准化和有充分记录的生物信息学工作流的需求。对允许精确基因组序列再现性的高效工作流程的要求尤其明显。此外,大多数已发表的研究仍然没有提供必要的细节来复制他们的生物信息学分析,并且经常仅仅列出所使用的软件工具的名称和版本号。另一方面,随着NGS技术提供的基因组资源的快速增加,高效和标准化的元数据管理方法对于生物数据的后处理阶段变得越来越重要。特别是在使用环状叶绿体基因组数据的基于细胞器的研究中,主要结构区域的随机组合(顺序和方向)是对无论大小分类单元形成用于系统发育重建的“现成对齐数据集的能力的主要限制。此外,在目前的实际操作中,在基因组中可帮助用来对比其他编码区的最多变的区域常被删掉。尽管如此,目前还没有一款软件可以通过对主要的质体区域的检测、组织和定位达到这种程度,这使得固化过程既耗时又容易出错。为了解决这两个主要问题,本论文将集中在四个主要章节:第一章介绍叶绿体基因组测序、组装、注释、比对、系统进化树推断中最常用的方法和工作流程,以及对软件选择和精确设置高度敏感的过程。在NGS驱动的基因组研究中,生物信息学工作流程的标准化和可重复性举足轻重。这是由以前几个植物系统发育学研究以及影响下游分析进而影响最终结果的软件工具获得的经验。第二章描述利用最新系统发育策略对孔药楠(Sinoporahongkongensis)叶绿体基因组重新组装的实际应用,主要由分子实验、生物信息学工作流程以及质体基因组测序和表征的结果三个部分组成。其中,组装和注释这个质体基因组的生物信息学步骤做详细描述。在组装和注释这个基因组后,将其与樟科和其他科的代表性物种进行比较。在此,我们比对18个物种的所有叶绿体DNA(cp DNA)区域然后进行一个简单的系统进化树推理,作为整个工作流完整性的概念证明。第三章介绍一个方便快捷且容易使用的软件---ECu ADOR。这个软件基于Perl脚本算法,专门用于自动检测和重组从任何来源(NGS,桑格测序或组装输出)获得的质体序列。ECu ADOR使用滑动窗口方法检测原始序列中的长重复序列,然后识别反向重复序列(IRs)(即使在人为或测序错误的情况下),并自动将序列重排为广泛使用的LSC-IRb-SSC-IRa顺序。这有助于快速的后续编辑步骤,例如基因组比对、可变区检测、单核苷酸多态性(SNP)检测和系统发育分析。ECu ADOR对被子植物不同科的161个质体测试成功。ECu ADOR首先为每个数据集鉴别并重新排序中心区域(LSC-IRb-SSC-IRa),然后为叶绿体序列进行新注释。该过程耗时不到20分钟,最大内存需求为150 MB,准确率超过99%。ECu ADOR是唯一一个从头开始的一步识别和重新排序工具,方便来自NGS数据的核外基因组的后续处理分析。这个程序可在https://***/Biodiv Genomic/ECu ADOR/下载。第四章为本研究最重要的结果的总结,强调主要目的、新颖性、发现和未来方向。此研究试图涵盖当今现代系统发育学所面临问题的广阔领域,并总结由于分子和基因组数据的出现,系统发育学领域正在经历的一些最紧迫的挑战。我们强调自动化数据挖掘方法仍然不完整且会随着时间的推移而变化,而这些方法可能会产生错误的数据和结果。这种错误可能会降低系统发育的准确性,并且在缺乏专业知识的情况下无法被发现。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分