咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的串联质谱蛋白质鉴定方法研究 收藏
基于深度学习的串联质谱蛋白质鉴定方法研究

基于深度学习的串联质谱蛋白质鉴定方法研究

作     者:许睿 

作者单位:重庆邮电大学 

学位级别:硕士

导师姓名:朱云平;梁亦龙

授予年度:2020年

学科分类:0710[理学-生物学] 071010[理学-生物化学与分子生物学] 07[理学] 

主      题:蛋白质序列数据库 串联质谱 深度学习 同位素峰强度 

摘      要:基于串联质谱的肽鉴定是蛋白质组学的关键算法之一,而蛋白质序列数据库搜索是目前常用的肽鉴定方法。在传统的蛋白质序列数据库搜索中,通常需要先对每个肽段进行理论谱的构建,只考虑了质荷比的信息,但是与同位素峰值强度相关的信息被忽略了。近年来,随着人工智能技术的飞速发展,基于深度学习的MS/MS谱预测工具显示出了很高的准确性,在提高蛋白质序列数据库搜索的灵敏度和准确性方面具有很大的潜力。本文针对传统的蛋白质序列数据库搜索方法,通过考虑同位素峰强度相关信息对搜索流程进行优化,主要研究内容包括以下两个方面:(1)评估常用基于机器学习、深度学习的谱预测工具。利用机器学习或深度学习模型进行谱图预测是计算蛋白质组学的一种新兴方法。基于深度学习的MS/MS谱预测工具在提高data-dependent acquisition(DDA)搜索引擎的灵敏度和准确性,以及建立data-independent acquisition(DIA)分析的谱库方面具有巨大的潜力。不同的工具有其独特的算法和实现,可能会导致不同的性能。因此,有必要对这些工具进行系统的评估,以找出它们的偏好和内在差异。在本研究中,我们使用具有不同碰撞能量、酶、仪器和物种的多个数据集来评估基于深度学习的MS/MS谱预测工具和基于机器学习的MS2PIP工具的性能。我们发现p Deep2和Prosit在大多数情况下都优于其他工具,而且不同的工具都有自己的特点。例如,Prosit在预测Lumos产出的质谱方面效果最好;p Deep2在预测Q Exactive产出的质谱方面效果最好。我们还评估了深度学习工具在GPU和CPU上的预测时间。使用GPU时,预测速度极快;当只使用CPU时,对于许多任务,预测速度仍然可以接受。(2)利用深度学习优化蛋白质序列数据库搜索方法。我们选择使用深度学习模型(p Deep2)来预测所有候选肽的理论质谱,并将预测得到的碎片离子强度作为肽鉴定的比较参数之一应用于蛋白质序列数据库搜索工具(Deep Novo)中。在Deep Novo中,我们对模型的输入输出中间过程进行调整,将p Deep2与Deep Novo结合,从而提高了肽识别的敏感性和准确性。结果表明,在考虑了同位素峰强度后的肽鉴定,在氨基酸和肽水平上的召回率和准确率都提高了约2%。通过评估谱预测工具,我们系统地总结了各谱预测工具的性能。我们希望评估结果可为相应的研究人员提供频谱预测工具的思路和指导。p Deep2与Deep Novo结合的结果也表明,考虑同位素峰强度能够有效提高肽鉴定准确性和谱图解析率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分