基于机器学习和生物信息学探索CAF相关基因在肺鳞癌中的预后价值研究
作者单位:浙江科技大学
学位级别:硕士
导师姓名:吴志宏
授予年度:2024年
学科分类:1002[医学-临床医学] 100214[医学-肿瘤学] 10[医学]
主 题:肺鳞癌 CAF 预后标志物 预后风险模型 生物信息 机器学习
摘 要:肺癌以往在我国癌症中的发病率和死亡率均居首位,肺鳞癌是第二常见的肺癌类型。肺鳞状细胞癌晚期无明显症状,大多发现时已到中晚期,预后效果较差。晚期肺鳞癌无手术根治的机会,且因缺乏有效的靶向药物,治疗手段非常有限。很少发现生物标志物能有效地预测肺鳞癌患者的预后。因此需要开发新的预后生物标志物和治疗靶点以达到更好的预后。间质癌症相关成纤维细胞(Cancer-associated fibroblast,CAF)可以通过分泌多种细胞因子和基质重塑蛋白,促进肿瘤细胞生长、血管生成和化疗耐药,从而促进肿瘤生长、侵袭和转移。据报道,肿瘤微环境中的CAF通过CAF相关基因表达的一些特异性蛋白与肺鳞癌生存率相关。CAF中新靶点的发掘对于肺鳞癌的治疗及预后具重要意义。基于此,本研究通过机器学习和生物信息学方法构建了肺鳞癌基于CAF相关基因的预后风险评分模型,以期为肺鳞癌的预后治疗和管理提供新的思路。本文的主要结果如下:(1)基于加权基因共表达网络(WGCNA)分析筛选肺鳞癌中CAF相关基因。选取了基因模块中与CAF最相关的928个基因,进行后续分析。(2)基于差异分析和机器学习进一步分析肺鳞癌CAF相关的特征基因。获取了416个差异基因,再通过支持向量机递归特征消除(SVM-RFE)、最小绝对收缩和选择算子(LASSO)和随机森林(RF)三种机器学习的筛选,最终筛选出了79个最具特征的CAF相关基因,并获得了一个可以作为肺鳞癌诊断的生物标志物TGFBR2基因,并进行了评估和验证,具有非常好的诊断效果。(3)基于单因素Cox、LASSO回归和多因素Cox回归分析开发肺鳞癌基于CAF相关基因的预后风险模型。筛选出3个独立预后的CAF相关基因,分别是IER5L、HSPB7和MYADM,并评估和验证了模型的可靠性和准确性。(4)基于CAF相关基因的预后风险模型,分别得出参与构建模型的三个独立预后CAF相关基因的预后价值,均为基因表达高的患者预后差,可作为肺鳞癌的预后标志物。接着分析风险组之间的免疫治疗差异,发现高风险组在免疫治疗时更容易发生免疫逃逸。同时,还分析了风险组间免疫细胞的差异,其中记忆静息T-CD4细胞,静息NK细胞、巨噬细胞M0和中性粒细胞、T-CD8细胞、T-CD4记忆激活细胞、T-γδ细胞和树突状静息细胞等在风险组之间显著差异。最后,进行基因集富集分析,得出高风险组富集在细胞粘附分子、补体和凝血级联、细胞因子与细胞因子受体相互作用、ECM受体相互作用和焦点粘附等通路有关,低风险组富集在抗坏血酸和醛酸代谢、氧化磷酸化和核糖体等通路有关。本文基于四个部分对肺鳞癌患者的数据进行挖掘,分析得到3个CAF相关基因IER5L、HSPB7和MYADM可作为肺鳞癌的预后标志物,并构建的预后风险模型可作为肺鳞癌的独立预后因子。