咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的蛋白质金属离子结合位点预测方法研究 收藏
基于深度学习的蛋白质金属离子结合位点预测方法研究

基于深度学习的蛋白质金属离子结合位点预测方法研究

作     者:张赛军 

作者单位:华中科技大学 

学位级别:硕士

导师姓名:薛志东

授予年度:2020年

学科分类:0710[理学-生物学] 071010[理学-生物化学与分子生物学] 07[理学] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 

主      题:卷积神经网络 递归神经网络 金属阳离子 蛋白质 结合位点 

摘      要:蛋白质通过与其他配体分子的相互作用来执行其功能。目前发现一半以上的蛋白质与金属离子有结合位点,金属离子既稳定了蛋白质结构又调节了蛋白质的生物学功能。例如,金属铁离子(Fe)与血红蛋白的结合对于其通过血液携带和转移氧气的功能致关重要。金属Zn离子与核酸酶和转录因子的结合在锌结构域的行成中起着至关重要的结构作用,因此准确识别蛋白质离子结合位点对于理解蛋白质功能机制和发现新药非常重要。蛋白质与金属离子蛋白质结合位点的预测,本质上属于蛋白质残基水平的预测。在3D结构中作为邻居的残基在序列上可能相距很远。这些局部或非局部依赖性对于残基级别的属性预测至关重要。为了对这些依赖性进行建模以提高预测性能,采用ACNN+GRU混合深度学习方法捕获局部依赖特征和长相关性特征。ACNN学习蛋白质序列的局部依赖特征,使用GRU学习蛋白质的长依赖特征。然后对融合特征进行分类,直接得到该蛋白质序列上结合位点的预测结果。混合深度学习模型是一个端到端模型,不需作人工特征筛选,不需要进行数据预处理和后处理。输入蛋白质序列,即可得到对应的蛋白质序列预测结果。为了解决蛋白质结合位点和非结合位点数据不平衡的问题,改进了交叉熵函数损失函数使得它既能平衡正负样本又能关注难样本和错分样本。在提取的金属离子数据集上,按8:1:1的比例划分数据集,最终在测试集上性能指标较其他方法均取得了较大的提升。在训练集上各项指标均优于以前的方法,在测试集上大部分离子的Pr均高于对比方法20%左右,ACC和Sp也高于10%左右。本文的模型使用MCC、Precision、Accuracy、Sp、Sn作为评估标准。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分