剪接位点识别与选择性剪接机制的初步研究
作者单位:清华大学
学位级别:硕士
导师姓名:李衍达
授予年度:2004年
学科分类:0710[理学-生物学] 07[理学] 071007[理学-遗传学]
主 题:选择性剪接 数据库 剪接位点识别 剪接机制 嘌呤/嘧啶浓度
摘 要:RNA的选择性剪接是在高等真核生物基因中普遍存在的一种生命现象,它在真核基因表达调控中起着十分重要的作用。有关选择性剪接的研究是功能基因组时代的重要前沿问题之一。本论文围绕这一重要生命现象展开研究,主要包括下面三部分内容: 首先,为了对选择性剪接现象进行研究的需要,我们建立了一个哺乳动物(人、小鼠和大鼠)选择性剪接基因数据库AsMamDB,为相关研究人员提供了一个优秀的数据源。 其次,在剪接位点识别方面,考虑到剪接位点附近序列的各个碱基之间应该存在某种相关性,我们设计了专门用于剪接位点识别的隐马氏模型(HMM)方法。实验结果表明,用HMM描述剪接位点附近序列符合实际情况,并且可以很好地提取位点附近保守序列的统计特征,对真实剪接位点和虚假剪接位点都有较高的识别率。进一步,我们将该方法用于选择性剪接位点的识别,实验结果表明选择性剪接位点与非选择性剪接位点在位点附近序列的统计特征上具有相似性。这一结果对于进一步研究真核基因的剪接机制,特别是选择性剪接发生的机理有很大的启发。 最后,我们对真核基因的剪接机制,以及选择性剪接的机制进行了初步的研究。目前,关于选择性剪接的机理尚未明确,我们从剪接位点附近嘌呤/嘧啶浓度分布出发,对剪接位点及选择性剪接位点数据进行了聚类,并从各个聚类中提取了具有一定生物意义的保守短序列。这些保守短序列很有可能在剪接位点的选择过程中发挥重要的作用。在此基础上,我们提出了一种可能的剪接机制:由嘌呤/嘧啶浓度与保守短序列共同指导的RNA剪接过程,即“粗定位——细定位过程:在剪接过程中首先有一粗略的定位过程,根据序列的嘌呤、嘧啶浓度特征寻找出剪接位点的大致位置;然后在这一基础上,根据几个保守碱基所提供的信息找到准确的剪接位点。