咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于轻量级深度学习模型的蛋白质骨架二面角预测 收藏
基于轻量级深度学习模型的蛋白质骨架二面角预测

基于轻量级深度学习模型的蛋白质骨架二面角预测

作     者:郑美丽 

作者单位:安庆师范大学 

学位级别:硕士

导师姓名:张步忠

授予年度:2023年

学科分类:0710[理学-生物学] 12[管理学] 071010[理学-生物化学与分子生物学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081704[工学-应用化学] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 0817[工学-化学工程与技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:骨架二面角 空洞卷积 混合感知块 注意力机制 轻量级模型 

摘      要:蛋白的结构与其功能密切相关,因此,解析蛋白的结构已成为当前的重要课题。蛋白质主链上N-C键和C-C键形成的二面角(Φ,Ψ)对蛋白质三维结构和空间构象起着重要作用,是蛋白质主链的主要自由度。从蛋白质一级序列出发,预测骨架二面角可以加速对低能结构构象空间的有效采样,大大推进三维结构预测,可作为生物实验的有效快速辅助手段。基于此,本文主要研究内容如下:1)深入研究分析计算方法预测二面角问题。首先分析计算方法解决该问题的模式,包括氨基酸残基的计算方法表征、二面角预测结果的表示、预测性能评价标准和常用数据集等,然后分析了传统机器学习方法在二面角预测中的应用,并对近几年来的基于深度学习模型的诸多研究工作进行系统归纳与整理,对比分析了各算法特点及存在的问题。2)随着蛋白质生物样本数据增多和计算性能的提升,近年来,深度学习方法在蛋白质二面角等结构特征预测等问题中取得了较好进展。但现有代表性的预测方法,存在的问题有:多数由递归神经网络构建的模型无法并行训练,训练速度慢;模型参数庞大,消耗计算资源多,也不利于应用推广。本课题提出了一个轻量级的快速预测方法DCMA。基于卷积神经网络设计了一种混合感知块:由多个不同卷积尺度的卷积神经网络、多组卷积尺度相同但放大率不同的空洞卷积神经网络堆叠而成,旨在捕获输入序列的长程特征和局部特性;为了加强长短程特征捕获,一个多头注意力网络和两个混合感知块并行堆叠构成1A2I(两个混合感知块和一个注意力模块)模组,五组1A2I模组堆叠构成DCMA模型。为了约束预测结果,DCMA模型也采用了多任务学习策略。3)在DCMA模型的基础上,研究了蛋白质空间结构属性接触图、集成学习、蛋白质预训练模型提取的特征对DCMA的性能影响。实验表明:采用SPOT-1D软件预测的接触图作为残基表示特征,在软件预测精度较好的序列上能提升预测性能;多个独立训练的基模型集成在一起,能有效提升预测性能;蛋白质预训练模型ESM-1v和Prot T5的输出特征作为附加输入,同样能有效提升预测性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分