人类基因组中重要ERVs鉴定以及特征分析研究
作者单位:北京化工大学
学位级别:硕士
导师姓名:王磊
授予年度:2023年
学科分类:1007[医学-药学(可授医学、理学学位)] 100705[医学-微生物与生化药学] 1001[医学-基础医学(可授医学、理学学位)] 100103[医学-病原生物学] 10[医学]
摘 要:内源性逆转录病毒(Endogenous Retroviruses,ERVs)是一类存在于哺乳动物基因组中的逆转录病毒。这些病毒曾经感染过哺乳动物的祖先,而后通过逆转录过程被整合到宿主基因组中,并随着宿主的进化而一代代遗传下去。内源性逆转录病毒与其他基因不同的是,它们的DNA序列中包含有逆转录病毒所特有的核苷酸序列,如长末端重复序列(Long Terminal Repeats,LTRs)和逆转录酶等。这些序列的存在使得内源性逆转录病毒有可能在宿主基因组中进行转录和翻译,从而产生病毒颗粒并感染细胞。在人类基因组中,也存在许多的内源性逆转录病毒。本文运用Basic Local Alignment Search Tool(BLAT)工具,针对人类标准参考基因组HG38,开发了在contig序列上鉴定新的内源性逆转录病毒位点的方法,并且在下载的contig基因组上发现了新的内源性逆转录病毒位点,通过Repeat Masker工具找出了HG38上的内源性逆转录病毒基因,并且建立了本地数据库。基于数据库中数据,对干扰素受体敲除的THP1细胞进行了转录组分析。本文主要得到以下几个结果:(1)通过运用BLAT工具,我们以人类参考基因组HG38为标尺,建立了在contig序列数据中鉴定内源性逆转录病毒新位点的方法。(2)通过Repeat Masker(一种常用的基于比对的DNA序列分析工具,用于检测DNA序列中的重复元件和转座子)、Python Django(是一种基于Python编程语言的Web框架,它可以帮助开发者快速构建复杂的、高性能的Web应用程序)和MYSQL(一种开源的关系型数据库管理系统),开发了收录HG38基因组中内源性逆转录病毒元件的序列数据库,提供了染色体位置查询,序列查询,序列大小查询等功能,并对各个亚型序列进行了统计和展示。(3)基于上述建立的数据库中的内源性逆转录病毒基因,对干扰素受体敲除细胞(THP1细胞)进行内源性逆转录病毒的转录组分析,发现ISGs(干扰素诱导的基因)和内源性逆转录病毒元件的RNA表达是相关的,表明内源性逆转录病毒元件与宿主天然免疫应答密切相关。综上,本文首先建立了一种可从contig序列数据中鉴定内源性逆转录病毒元件位点的方法,针对发现的HG38基因组中的内源性逆转录病毒序列建立起本地的内源性逆转录病毒基因数据库,最后基于数据库的内源性逆转录病毒基因对干扰素受体敲除细胞(THP1细胞)进行内源性逆转录病毒的转录组分析,最后发现ISGs(干扰素诱导的基因)和内源性逆转录病毒元件的RNA表达是相关的,表明内源性逆转录病毒元件与宿主天然免疫应答密切相关。