非角化型鼻咽癌分子分型及其调控网络研究
作者单位:南方医科大学
学位级别:硕士
导师姓名:黄仲曦
授予年度:2013年
学科分类:1002[医学-临床医学] 100214[医学-肿瘤学] 10[医学]
主 题:鼻咽癌 分子分型 转录调控网络 蛋白相互作用网络 竞争内源性RNA网络
摘 要:研究背景和目的 癌症是一种异质性很强的疾病。临床上具有相似相近分期分型的癌症患者对于治疗的反应存在差异,预后情况也参差不齐。基于基因表达谱的分子分型在多种肿瘤中已有报道。同一种肿瘤的不同分子亚型的预后情况,对药物治疗的反应,对远处转移位点的偏好等等都存在差异。对不同分子亚型可能需要采取不同的治疗方案。鼻咽癌是一种在东南亚地区高发的癌症,主要为非角化型鳞癌。鼻咽癌在临床上的表现具有异质性。目前,以鼻咽癌分子亚型为主题的研究尚未见报道。尽管有研究认为鼻咽癌中不存在分子亚型,但是本课题组认为:该研究使用了较早版本的芯片注释文件,探针集的注释可能存在较多的错误;另外,该研究的聚类分析是基于芯片上所有的的探针集,受噪声影响可能较大。目前,公共数据库中可利用的鼻咽癌基因表达谱有56例,本研究新增25例,这为鼻咽癌分子分型提供了条件。如果能够确认鼻咽癌分子亚型的存在,很有可能对鼻咽癌的发生发展提供新的认识,对诊断与治疗起到指导作用。 方法 1.基因芯片数据 本研究主要分析了三组不同来源的基因表达谱数据集。其中部分数据下载自公共数据库GEO,包括GSE12452(31例鼻咽癌及10例正常鼻咽上皮组织)和GSE13597(25例鼻咽癌及3例正常鼻咽上皮组织)。此外,本课题组新增了25例鼻咽癌及8例正常鼻咽上皮组织的芯片数据。 此外,EB病毒编码基因在GSE12452中31例鼻咽癌组织的表达情况(QRT-PCR数据来自原作者)也被纳入我们的分析。 2.聚类分析 我们采用了无监督等级聚类算法(unsupervised hierarcahical clustering),自组织图聚类算法(self-organized map), K-means聚类算法分别对GSE12452的41例芯片数据和GSE13597的28例芯片数据进行了聚类分析。 3.筛选差异表达基因及标签基因的比较 我们首先比较了亚型之间的基因表达谱,用SAM算法对每个基因之间差异表达的显著程度进行了评估。我们还将各个鼻咽癌分子亚型单独与正常鼻咽上皮基因表达谱用SAM算法进行比较。 4.基因集富集分析(Gene Set Enrichment Analysis) 我们使用基因集富集分析(GSEA)对鼻咽癌亚型之间的生物学差异进行了比较。在分析之前将表达谱数据转换成GSEA软件能识别的格式,并将基因表达值转换成线性值(linear-scale)。我们使用了GSEA提供的来自已发表文献的数千个标签基因集进行分析。 5.鼻咽癌分子亚型基因预测器的构建 构建分子亚型预测器使用的是经过Combat处理的GSE12452与GSE13597数据集。本分析使用了Gene Pattern平台中的WeightedVotingXValidation以及WeightedVoting模块。首先以GSE12452为训练集(31例样本),每次取出一例样本,根据剩余的30例样本,筛选出50个预测器基因(此过程即为交叉验证,cross-validation),并用于对预先排除在外的样本的类别归属进行判定。挑选在所有31轮预测中均被选中的基因,得到一个基因列表,此分析由WeightedVotingXValidation模块完成。作为验证,再将上述所得基因作为预测器,使用WeightedVoting模块中对GSE13597中的鼻咽癌样本类别归属进行预测。 6.转录调控网络构建 我们使用软件ARACNe构建转录调控网络。首先将91例芯片数据整合然后用combat软件处理批次效应。从数据库animalTFDB下载转录因子列表。在ARACNe分析之前,对基因根据其表达值的变异程度进行了筛选,只保留具有一定波动的基因。在ARACNe分析中,选用了高斯核估计(Gaussian kernel estimator)用于交互信息的计算,并将MI值的阈值设置为p值不超过0.05,对DPI分析的容忍度设置为0%。为了使MI值的估算更加准确,做了100次的自举(bootstrap),并通过一致性投票(consensus voting)确定最终的转录调控关系。采用fisher精确性检验评估各个转录因子的预测靶基因与鼻咽癌分子亚型标签基因之间的重叠是否具有统计学显著性。 7.蛋白质-蛋白质相互作用网络构建 我们将鼻咽癌亚型标签基因提交到网站STRING,提取标签基因蛋白产物之间的相互作用关系。为了验证在标签基因之间的蛋白质蛋白质相互作用是否是随机出现的,我们还随机抽取了1000组相同数目的基因上传到STRING作为对照。 8.竞争内源性RNA (ceRNA)网络构建 我们首先从数据库starbase下载了microRNA与靶基因的作用对。参考