咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多组学数据分析和深度学习的预后风险评估算法研究 收藏
基于多组学数据分析和深度学习的预后风险评估算法研究

基于多组学数据分析和深度学习的预后风险评估算法研究

作     者:韩孟杰 

作者单位:吉林大学 

学位级别:硕士

导师姓名:徐鹰

授予年度:2022年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:癌症 多组学数据分析 预后风险评估 图神经网络 卷积神经网络 注意力机制 

摘      要:使用全基因组的多组学数据可以为癌症风险的预测提供有价值的信息,将多维组学数据与癌症结果(生存或死亡)相关联有助于弥合基因组信息与临床医学之间的差距。通过整合多组学数据,根据患者特定的基因组成评估医疗风险(即预后风险评估),可以及时对患者提供预后干预,显著提高患者生存率。将高维低样本量的多组学数据集成到预后风险评估中存在统计学和计算上的挑战,而且现有的基于神经网络对多组学数据进行预后风险评估的算法较少考虑病人间的拓扑关系,也忽略了生物网络中的图结构本身是具有噪音的。为了解决上述的局限性,本文首先通过统计检验的方法,结合肿瘤相关知识筛选具有鲁棒和生物学意义的基因,并结合生物学知识对基因进行了生信分析。以5年生存率为标准筛选两大类肿瘤,结合广义似然比检验和倍数法筛选肿瘤组织与正常人体组织表达水平存在差异的基因,使用超几何检验的方法将基因富集到通路。因为通路存在冗余的情况,而不同通路之间的关系可以用有向无环图表示,因此本文结合基于节点和基于边两种算法的优势,计算通路之间的相似性并划分功能集。通过对功能集进行生物分析,证实筛选获得的基因在肿瘤发展过程中具有重要的生物学意义。其次,我们在生信分析获得基因集的基础上,提出了一种新的肿瘤预后风险评估方法,它结合了图神经网络、卷积神经网络和多种注意力机制,来对肿瘤患者进行预后风险评估,实现生存风险分层。模型主要分为三个框架:(1)基于双重注意力机制的图神经网络,它通过节点层面的注意力机制计算某节点的邻居节点的不同贡献度,对各个节点的嵌入表示进行加权聚合;通过节点之间的关联层注意力机制来聚合不同节点之间的相似性关系;最终可以学习节点间的网络拓扑结构,也能充分考虑各个节点的重要性关系、节点与其邻域节点的相关性强弱,聚合多种信息,进而学习到鲁棒的语义表示。(2)多组学注意力机制结合卷积神经网络,先对组学特征分别进行卷积操作,充分学习组学特征内表示,然后通过组学注意力机制权衡不同组学对预后风险评估的贡献不同,最后将组学语义信息通过卷积融合得到全局组学语义表示。(3)为了更好地利用两种预后模型的优势,我们提出了基于图重要性嵌入和组学重要性嵌入的预后模型。实验通过十折交叉验证在胰腺癌的多组学数据以及生存数据上进行训练,结果表明该方法取得了最好的效果,能有效的划分胰腺癌的生存亚型。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分