咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习方法识别小干扰RNA 收藏
基于深度学习方法识别小干扰RNA

基于深度学习方法识别小干扰RNA

作     者:步媛媛 

作者单位:大连海事大学 

学位级别:硕士

导师姓名:贾藏芝

授予年度:2023年

学科分类:0710[理学-生物学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 071007[理学-遗传学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:RNA干扰 VsiRNAs Word2vec FastText 集成学习 深度学习 

摘      要:RNA干扰是一种特殊的转录后基因沉默现象,它是由双链RNA分子通过耗能过程降解为21-23nt的小干扰RNA(small interfering RNA,si RNA)从而抑制同源m RNA的表达,在调节各种真核生物的基因表达方面发挥重要作用。本文研究了识别小干扰RNA的问题并构建了有效的预测模型,主要选用集成和深度学习算法。本文的研究内容具体如下:(1)针对植物中病毒衍生的专属小干扰RNAs识别精度较低的问题,本文采用深度学习和集成学习方法构建了预测模型。我们基于卷积神经网络、多尺度残差网络和带有自注意力机制的双向长短期记忆(Bi-directional Long Short-Term Memory,Bi-LSTM)网络构建多层框架,学习word2vec和fast Text编码方案的序列信息。在选择最优参数组合后,我们保留了敏感度最高的五个模型。然后,通过比较不同的集成策略,我们采用逻辑回归将这个五个模型整合为最终的预测器,命名为COPPER。为了进一步证明COPPER的泛化性,我们将其与PVsi RNAPred在独立数据集上进行了比较,并评估了其在具有不同相似性的si RNA序列的同源效应上的性能。此外,还进行了烧蚀研究,以确定模型中每个部分的重要性。(2)相位小干扰RNA(phasi RNA)是植物次生小干扰RNA,通常由mi RNA和聚腺苷化m RNA聚合产生。本文提出了使用深度学习方法预测mi RNA触发phasi RNA位点的预测器DIGITAL。首先从Tar DB数据库中收集阳性数据,获得了5408个mi RNA触发21-nt phasi RNA的数据和443个mi RNA触发24-nt phasi RNA的数据,并通过在阳性样本中随机替换一定数量的核苷酸生成阴性数据。然后使用one-hot方法对生物序列编码,在基于多尺度残差网络和双向LSTM的深度学习模型上对数据进行训练,并通过贝叶斯优化来选择最佳参数,以使ACC值最大化。此外,还构建了六种传统的分类算法:支持向量机、朴素贝叶斯、k近邻、极端梯度提升、逻辑回归和随机森林,并与DIGITAL进行比较,结果表明了我们模型有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分