咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于图注意力网络与简单循环单元的化合物—蛋白质交互预测 收藏
基于图注意力网络与简单循环单元的化合物—蛋白质交互预测

基于图注意力网络与简单循环单元的化合物—蛋白质交互预测

作     者:贾琳 

作者单位:河南财经政法大学 

学位级别:硕士

导师姓名:李淑红

授予年度:2021年

学科分类:1007[医学-药学(可授医学、理学学位)] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 100701[医学-药物化学] 10[医学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:化合物-蛋白质的交互 深度学习 图注意力网络 简单循环单元 

摘      要:药物发现是发现新药治疗或治愈人类疾病的过程,而其中一项关键的任务是化合物-蛋白质交互的研究。由于化合物-蛋白质的交互不仅可以预测药物的靶向、探寻药物的药效,而且对于预测药物的副作用、毒性等方面也起着关键性作用。因此,如何通过识别化合物-蛋白质的交互来发现新药物已经成为研究人员关注的热点。若使用传统的方法对化合物-蛋白质的交互进行预测,则需要对大量的化合物-蛋白质对逐一进行实验,因此存在着实验周期长、成本代价昂贵、准确率低等缺点。近年来,随着机器学习的不断发展,基于机器学习的方法逐渐被用于学习药物和靶点结合的特点,利用机器学习来协助药物的设计,能够极大程度的提高设计成功的概率。深度学习是机器学习的子集,能够实现特征的自动提取且有着强大的表征能力。可以通过海量数据对特定任务进行建模,相比传统方法能够有效提高模型预测的准确率,缩短训练时间。因此,近些年基于深度学习的方法被广泛应用于药物发现。而现有的基于深度学习的化合物-蛋白质交互预测方法未考虑数据的内部协变量偏移和长距离依赖问题。针对此问题,本文基于已有模型进行了改进,主要研究工作:(1)文中提出一种将图神经网络和循环神经网络相结合的化合物-蛋白质交互预测模型。通过利用图注意力网络-门控循环单元来学习化合物分子的图级表示,并利用多层简单循环单元学习氨基酸子序列的特征向量表示,结合多层前馈神经网络来预测化合物-蛋白质的交互作用。(2)由于原始的输入数据经过图注意力卷积操作后其概率分布会发生偏移,为有效解决此问题,将实例标准化操作引入图注意力网络中,使得网络输出数据的分布更切合数据的真实分布,从而保证模型的非线性表达能力。(3)多数现有方法使用卷积网络或长短期记忆网络对氨基酸序列进行处理,可能存在着长距离依赖问题,本文通过利用简单循环单元的特殊结构对序列数据进行处理,可以有效避免梯度消失减缓长距离依赖的问题。(4)本文通过Pytorch框架搭建模型,并完成对模型的训练与预测。通过在2个公开的生物数据集上进行实验,与现有模型进行对比实验,验证了本文的可行性,并通过设计相关实验验证了模型中各模块的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分