基因和基因组织结构分析
作者单位:河北工业大学
学位级别:硕士
导师姓名:展永
授予年度:2004年
学科分类:0710[理学-生物学] 07[理学] 071007[理学-遗传学]
主 题:基因,基因组,密码子,终止密码子,碱基分布,小波变换
摘 要:自从人类基因组计划实施以来,大量的DNA数据己被测定。在基因和基因组水平分析这些序列的结构特征是亟待解决的问题。本论文主要包括两方面的内容:基因结构特征分析和基因组结构特征分析。 论文第一章简单介绍了人类基因组计划,阐述了生物信息学产生的背景,并对与研究课题相关的生物学知识作了简单的介绍。 论文第二章讨论了蛋白质编码区基因的结构特征。通过对11种具有不同G+C含量的微生物基因组进行分析,显示蛋白质编码区碱基分布具有不对称性。对单核苷酸和双核苷酸的使用进行统计分析,结果表明与终止密码子对应的组分的含量都很低。由此得出结论:终止密码子对蛋白质编码区碱基的使用具有限制作用。 论文第三章介绍了小波变换。小波变换是分析非平稳信号的有效工具。利用小波消噪技术可以滤除信号噪声,提取出信号的突变点。 论文第四章分析了基因组的Isochore结构。真核生物基因组具有mosaic结构,即在较大区域上G+C含量相对均匀,而相邻区域G+C含量差别很大,这些区域被称为Isochores。识别真核生物基因组的Isochore边界是生物信息学尚未很好解决的问题之一。本论文提出组合窗口模型方法识别人类基因组的Isochore边界,利用滑动窗口可以连续地提取基因组的G+C含量,小尺度窗口可以提取局域信息,大尺度窗口可以提取全局信息,组合两方面的信息,并结合小波消噪技术可准确地识别人类基因组的Isochore边界。