陆地棉110个BAC测序结果的初步分析
作者单位:华中农业大学
学位级别:硕士
导师姓名:喻树迅
授予年度:2008年
摘 要:本研究挑取了陆地棉TM—1第12、26染色体上的110个BAC克隆对其进行测序和分析,这些BAC克隆插入片段的平均大小是100KB。测序和拼接后首先对其结构、基因功能进行了分析、注释,后通过比较基因组学的方法推测棉花与杨树、拟南芥、葡萄、水稻、玉米进化距离的远近关系。 结构分析包括基因分布的分析、基因大小及其外显子和内含子的分析、基因岛的分析、GC含量和重复序列的分析等。分析后发现一个富含14个基因的基因岛,该基因岛中的基因产物包含二磷酸核苷磷酸酶1、黄氧素乳酸脱氢酶、poly A结合蛋白、金属离子结合蛋白、伤诱导蛋白、生物素羧基载体蛋白羧化酶等。GC含量的分析显示BAC序列的平均GC含量只有34.2%,比水稻、拟南芥等基因组的平均GC含量低得多,且GC含量与基因的分布、基因的密度、基因序列占BAC总长度的比例呈负相关性,但基因中的GC含量仍明显高于其他区域的GC含量。 通过将测序序列预测到的基因与nr库、swissport库比对,除发现棉酚相关基因外,还发现一系列棉花开花和颜色相关基因、抗性相关基因,且发现的基因涉及其代谢的不同环节;此外,用基因序列与棉纤维EST比对,发现396个possible gene与棉纤维EST匹配上,其中包括多个信号转导途径、细胞壁松弛蛋白、细胞骨架蛋白、长链脂肪酸蛋白、木质素相关基因等。该结果为棉花重要性状相关基因的克隆及研究提供了参考。 共线性分析表明,棉花BAC与杨树、葡萄、拟南芥的共线性染色体片段比与水稻、玉米的共线性染色体片段多;为进一步分析棉花与杨树、拟南芥、葡萄、水稻、玉米进化距离的远近关系,用FGF法和多重序列比对法对上述物种中的同源基因序列构建进化树,据进化树的聚类结果推测棉花与杨树的进化距离较棉花与葡萄、拟南芥的进化距离近。