咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于网络的蛋白质功能预测方法研究 收藏
基于网络的蛋白质功能预测方法研究

基于网络的蛋白质功能预测方法研究

作     者:谭凯 

作者单位:广西大学 

学位级别:硕士

导师姓名:陈庆锋

授予年度:2021年

学科分类:0711[理学-系统科学] 07[理学] 08[工学] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 

主      题:功能预测 网络整合 网络嵌入 多标签分类 随机游走 

摘      要:高通量实验方法的普及产生了大量的大规模分子和功能相互作用网络,这些网络为推断蛋白质的功能提供了丰富的信息。近来,基于网络的蛋白质功能预测方法取得了重大进展。这些方法基于网络嵌入方法,以捕获多个异构网络的非线性,低维特征表示来预测蛋白质功能。但是,大多数现有方法仅从多个网络中提取低维特征,而没有考虑每个网络特征向量与标签之间的相关性。此外,随着大量的可用序列和其它蛋白质属性信息(如蛋白质域信息,亚细胞位置信息)的产生,大量蛋白质属性信息和网络可以用于功能预测。但是传统的网络方法只能在无属性网络上进行分析,无法拓展到属性网络中。基于现有算法的限制和生物数据的发展,设计有效的预测方法来预测蛋白质功能非常有意义。本文主要提出两种蛋白质功能预测方法进行研究:(1)提出了一种基于深度神经网络(DNN)的多规范相关自编码器(MCAE)模型,该模型使用典型相关自编码器(C2AE)学习得到一个深层潜在空间以实现联合特征和标签嵌入,并将生成的潜在空间用于蛋白质功能预测。MCAE方法所生成的多网络特征和标签的潜在空间综合考虑了每个网络特征和功能标签的相关性。此外,MCAE方法一起训练多网络集成和功能分类,而不是像大多数方法一样先通过多网络融合获得集成特征,然后训练分类器预测蛋白质功能。多个网络集成和功能分类的整体培训可以更好地利用多个网络的功能。MCAE模型是通过集成自动编码器的DNN体系结构实现的,该体系结构允许端到端的学习和预测。我们在人类和酵母数据集上测试MCAE模型,并将其与其它先进方法进行比较。结果表明,MCAE方法在蛋白质功能预测中引入多标签嵌入框架能达到更好的预测效果。(2)基于图神经网络提出深度学习模型GAE-GO来预测蛋白质功能,GAE-GO模型可以对属性网络进行分析,使用图变分自编码器(VGAE)来获取节点在属性网络中的嵌入。GAE-GO模型由两部分组成:第一部分是基于属性图的无监督表示模型,该部分同时利用网络信息(包括PPI网络,SSN序列相似性网络)和节点属性(包括蛋白质序列,亚细胞位置和蛋白质结构域)为每种蛋白质生成唯一的嵌入表示。第二部分是完全连接的深度神经网络(DNN)分类器来预测蛋白质功能。相比于传统网络计算方法只考虑在无属性网络中进行分析,GAE-GO模型将其拓展到属性网络中进行功能预测,可以同时考虑网络结构和蛋白质属性进行功能预测。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分