基于单细胞RNA测序的结直肠癌预后预测模型的建立和验证
Establishment and validation of prognostic prediction model of colorectal cancer based on single-cell RNA sequencing作者机构:上海交通大学医学院附属仁济医院消化科上海200001 上海交通大学医学院附属仁济医院胃肠外科上海200001
出 版 物:《上海交通大学学报(医学版)》 (Journal of Shanghai Jiao tong University:Medical Science)
年 卷 期:2021年第41卷第2期
页 面:159-165页
核心收录:
学科分类:0710[理学-生物学] 1002[医学-临床医学] 07[理学] 08[工学] 09[农学] 071007[理学-遗传学] 100214[医学-肿瘤学] 0901[农学-作物学] 0836[工学-生物工程] 090102[农学-作物遗传育种] 10[医学]
基 金:上海市教育委员会高峰高原学科建设计划(20161309) 上海交通大学医学院高水平地方高校创新团队(SSMU-ZLCX20180200)
摘 要:目的·基于单细胞RNA测序(single cell RNA sequence,scRNA-seq)技术构建结直肠癌预后预测模型。方法·利用GEO(Gene Expression Omnibus)数据库获取结直肠癌样本的scRNA-seq数据集,筛选与结直肠癌转移相关的差异基因作为预测模型的候选基因,运用套索回归算法(LASSO)、Logistic回归和Kaplan-Meier生存分析进一步在癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中筛选及验证与结直肠癌预后相关的基因集,并建立结直肠癌预后预测模型。通过决策曲线分析和受试者工作特征(receiver operating characteristic,ROC)曲线评估预测模型在临床应用中的价值。结果·利用GEO数据库获取的scRNA-seq数据筛选出30个差异表达基因,进一步在TCGA数据库中利用LASSO回归得到9个关键基因,并以此对每例患者的关键基因表达进行评分。分别在训练集和验证集中对复发和未复发患者的评分进行比较,差异均有统计学意义(P0.05)。采用Logistic回归分析将肿瘤原发灶分级(T stage)和是否发生远处转移(M stage)2个独立的临床变量纳入评分-临床变量整合模型。对评分-临床变量整合模型的实际预测价值进行评估,ROC曲线在训练集和验证集的曲线下面积分别为0.775和0.705。结论·基于scRNA-seq结果,构建了较为稳定的结直肠癌预后预测模型,可供临床评估患者预后参考。