基于SAH(蛛网膜下腔出血)的早期预警模型和相关细胞信号通路研究
作者单位:西南大学
学位级别:硕士
导师姓名:章乐
授予年度:2019年
学科分类:1002[医学-临床医学] 08[工学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0838[工学-公安技术] 100204[医学-神经病学] 10[医学]
主 题:蛛网膜下腔出血 生物信息学 关键基因选择 集成学习 信号通路
摘 要:蛛网膜下腔出血(Subarachnoid Hemorrhage,SAH)是指血液流入蛛网膜下腔(即蛛网膜与大脑周围软脑膜之间的区域)。SAH是一种临床综合症,具有发病范围广、死亡率高、致残率高、临床预后不良等特点,一直以来是基础和临床医学的研究重点和难点。为了降低SAH的发病率和死亡率,人们对SAH的发病机制展开了大量研究。近年来有研究发现早期脑损伤(EBI)可能是导致SAH患者预后不良的主要原因,寻找能够减轻SAH后EBI及相关并发症的治疗药物、有效靶点,预测和预防SAH是目前研究的重点方向。由于当前针对SAH药物的研究主要是从临床实验的层面选择药物,并未考虑从细胞信号通路层面讨论相关药物的作用,因此本研究的第一个科学问题在于,LCN2在细胞信号通路层面是否可以有效地干预或治疗SAH。由于以往研究主要通过临床医学实验在小范围的分子层面寻找能够预测或治疗SAH的有效靶点,为此本研究的第二个科学问题在于,是否可以通过考虑SAH疾病和LCN2药效因素,在全基因组层面分析和筛选有效的基因靶点。由于以往在SAH的早期预测主要依靠诊断影像或临床自动化数据,不仅准确率不高而且很少采用基因数据,因此本研究的第三个科学问题在于,是否可以利用关键基因来建立预测SAH的分类器,并通过集成学习模型提升预测准确率。根据上述三个科学问题,我们提出了以下三个创新点:(1)为筛选出对SAH药物敏感的关键基因,本文提出假设并设计了干预实验,通过筛选差异表达基因,对相关基因参与的信号通路在不同实验条件下予以基于超几何分布的统计分析;(2)在筛选关键基因时,本文同时考虑SAH疾病因素和LCN2药效因素,使用了多种数学方法结合的方式(e-Bayes、SVMRFE、SPCA和统计学检验)来选取关键基因,对高维度的基因芯片实现了有效降维;(3)构建了一个基于集成学习的SAH早期预警模型,有效提升了模型的预测精度、敏感度和正确率。该模型将关键基因的表达数据作为训练特征,首先利用Adaboost分别对LR、SVM和Naive-Bayes同态集成,再通过加权投票法进行异态集成。综上所述,本文首先设计了LCN2干预实验,在不同的实验条件下获得差异基因,并进行信号通路分析;我们发现LCN2可以引起一些关键信号通路(对SAH起缓解或促进作用)的变化,这说明LCN2在SAH后整个生物细胞过程中发挥了重要的作用。然后,本文同时考虑SAH疾病因素和LCN2药效因素,结合多种数学算法得到了5个关键基因:Tk1、Cyr61、Olig1、Pcolce2和Slc6a9;它们既对SAH疾病敏感,也对LCN2处理敏感,并且未随时间发生改变,且其中3个已有文献证明与脑出血相关。最后,将5个关键基因的表达数据作为输入,结合交叉验证方法,建立了基于集成学习的SAH早期预警模型,该模型的预测效果优于经典的LR、朴素贝叶斯和SVM模型。希望本文工作能为蛛网膜下腔出血(SAH)及相关疾病的临床治疗提供一个新的思路。