乳腺癌相关新关键基因和生物学通路的生物信息学识别
作者单位:苏州大学
学位级别:硕士
导师姓名:沈百荣
授予年度:2020年
学科分类:1002[医学-临床医学] 100214[医学-肿瘤学] 10[医学]
主 题:生物信息学 微阵列 乳腺癌 差异表达基因 新关键基因
摘 要:癌症对世界各地的人类健康有多种影响,它是仅次于心血管疾病的全球第二大死亡原因。全世界范围内不同地区的癌症发病率和死亡率不同,尤其是在不同国家之间,因为人口、生态、文化、环境和遗传变量等因素的差异会导致癌症发病率的异质性。根据最新的全球癌症数据,2018年癌症新增1810万例新病例,960万例死亡病例。其中前列腺癌、胃癌和肝癌在男性中最为常见,而乳腺癌、宫颈癌和甲状腺癌在女性中最为常见,肺癌和结直肠癌在两者中都具有较高的患病率。癌症的发病率最高的前三位是肺癌、乳腺癌和结直肠癌,它们的死亡率排名分别为第一、第五和第二。全球乳腺癌发病率自20世纪70年代末一直呈上升趋势,是全世界女性癌症死亡的第二大主要原因,99%发生在女性,男性仅占1%,约占女性所有癌症的26%。早期乳腺癌往往不具备典型的症状和体征,不易引起重视,常通过体检或乳腺癌筛查发现。与乳腺癌相关的危险因素有肥胖、酗酒、更年期激素替代疗法、电离辐射、月经初潮、晚育或不生育、年龄大、患乳腺癌的既往史、家庭乳腺癌史、缺乏体育锻炼等。乳腺癌是一种恶性肿瘤,是由某种基因突变导致的异常细胞的无节制增殖所致,这种基因异常通常发生在乳腺导管(连接乳腺与乳头的导管)或乳腺小叶(分泌乳汁的部分)中。随着科技时代日新月异的发展以及人们对乳腺癌认识的不断深入,乳腺癌的治疗进入了综合治疗时代,形成了局部治疗与全身治疗并重的治疗模式。医生会根据肿瘤的分期和患者的身体状况,酌情采用手术、放疗、化疗、生物靶向治疗等多种手段。外科手术在乳腺癌治疗中发挥着重要作用。但较其缺点来说——把病人体内肿瘤切除,并不能直接“消灭肿瘤,也不是战胜癌症的良方。控癌是场持久战,不能单独地“一刀切来解决问题。放疗是利用放射线破坏癌细胞的生长、繁殖,达到控制和消灭癌细胞的作用,但放射性在破坏和杀死肿瘤细胞的同时,对周围正常组织细胞也有破坏作用。手术、放疗均属于局部治疗。化学治疗是一种应用抗癌药物抑制癌细胞分裂,破坏癌细胞的治疗方法,简称化疗。化疗也可能会导致患者出现消化道反应,引起恶心、呕吐、头晕以及食欲不振等。分子靶向治疗是近年来最为活跃的研究领域之一,与化疗药物相比,是具有多环节作用机制的新型抗肿瘤治疗药。因此,更好地应用已发布的生物标志物、发现新的生物标志物以及潜在的治疗靶标对改善乳腺癌的预后和治疗至关重要。人表皮生长因子受体2(HER2)和雌激素受体α(ERα)常常被用于预后和激素治疗反应预测中,是目前最有效的乳腺癌生物标志物。但是,由于某些乳腺癌亚型并不表达ER α或HER2,因此需要应用其他生物标志物。然而,目前并没有发现其他生物标志物与靶向治疗的之间是否存在精准的关联。因此,迫切需要评估潜在的新生物标志物,以用于乳腺癌的诊断和治疗改善。癌症的发生率随着年龄的增长而增加,因此癌症的预防和治疗以及慢性病的管理已成为影响社会经济发展的关键因素。生物医学和信息技术的快速发展,以及主动健康、精准医疗和大数据范式的出现,为癌症的预防和治疗带来了新的机遇。本课题的研究方向包括癌症的异质性和外部综合征、癌症深度表型的挖掘、用于癌症治疗的联合用药算法、癌症的预防和治疗信息模型和慢性病的管理以及系统和平台构建。基于此,本研究的目的是通过生物信息学的方法来评估潜在的新基因作为乳腺癌诊断的生物标志物和药物靶标,并了解其分子机制,改进乳腺癌的治疗策略。首先,通过比较8个乳腺癌组织和相应对照组织的基因表达谱,我们检测到236个具有统计学意义的差异表达基因(包括167个上调基因和69个下调基因)。以***0.01和logFC1作为上调基因的阈值,***0.01和logFC-1作为下调基因的阈值,绘制火山图。根据| logFC |的值绘制热图。前20个上调的差异表达基因包括C2、IFITM1、AKR1C1、PCDH7、TIMP3、TDO2、AKR1C1、PMEPA1、IRF9、AQPI、KNDC1、OAS3、DDX60、FAM105A、DDX60、AQP3、IFI27、IFI44L和FN1;下调的差异表达基因包括EVL、CLDN1、CREB5、FBX015、CASP4、NOC2L、ATF6B、RELB、CCDC74B、MATN3、POLR3E、OSR2、CITED4、CASP4、LINC01016、C14orf37、TCTN1、CDADC1、CFAP206 和 C5orf45。为了了解筛选出的差异表达基因的生物学功能和意义,本研究使用了可用于注释、可视化和集成发现的DAVID数据库。使用在线工具“DAVID对候选差异表达基因进行GO功能富集分析(基因本体论(Gene Ontology,GO)是一种广泛用于整合生物学的方法,它为大规模的基因注释编写结构化、定义化和规范化的词汇)和KEGG途径分析(京都基因与基