咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于密集图自动编码器和多特征融合的circRNA-疾病关联预... 收藏
基于密集图自动编码器和多特征融合的circRNA-疾病关联预测

基于密集图自动编码器和多特征融合的circRNA-疾病关联预测

作     者:韩家乐 

作者单位:太原理工大学 

学位级别:硕士

导师姓名:王会青

授予年度:2023年

学科分类:08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 10[医学] 

主      题:相似性核融合 密集图自动编码器 circRNA-疾病关联 矩阵分解 图卷积网络 

摘      要:Circular RNA(circRNA)是一种共价闭合结构的RNA分子,其环状结构使它们在细胞中稳定存在,具有较长的半衰期,并且不易受核酸酶降解作用影响。circRNA在细胞分化以及肿瘤侵袭等生物过程中发挥着关键作用。由于其独特的环形结构和不易受核酸酶降解影响的特性,circRNA被用于肿瘤诊断和寻找潜在治疗靶点中。因此,研究circRNA-疾病潜在关联有助于研究复杂疾病的发病机制,对于研究疾病的诊断、预后和治疗具有重要意义。现有的circRNA-疾病关联预测方法主要包括传统生物实验方法和计算预测方法。传统生物实验方法采用PCR和微阵列等生物技术,可信度高,但其过程复杂、昂贵且耗时,难以实现大规模circRNA-疾病关联预测;而计算预测方法基于circRNA和疾病相似性信息,通过矩阵分解提取线性特征,或采用机器学习、深度学习的方法学习非线性特征,可以有效预测circRNA-疾病间的关联,降低了circRNA-疾病关联预测的成本。然而,现有方法在特征提取过程中未考虑相似性数据中的拓扑结构信息,并且忽略了circRNA和疾病的线性特征与非线性特征的相互补充,影响了所提取的特征质量。针对上述问题,本文构建了基于密集图自动编码器和多特征融合的circRNA-疾病关联预测模型,主要研究内容如下:(1)现有方法忽略了circRNA和疾病相似性数据中丰富的拓扑结构信息,而图神经网络通过图嵌入可以获取相似性数据的拓扑信息。在融合circRNA与疾病多源相似性数据时,现有方法采用线性融合算法,无法获得circRNA与疾病数据的非线性特征,影响了特征提取的质量。针对以上问题,本文提出了基于相似性核融合和注意力强化-图自动编码器的circRNA-疾病关联预测模型CDA-SKAG。本文引入相似性核融合算法获取circRNA和疾病相似性矩阵中的非线性特征;采用图自动编码器分别学习circRNA和疾病的拓扑特征表示,并嵌入注意力强化层自适应优化特征,以捕获circRNA和疾病相似性中的潜在关联信息,实现潜在circRNA-疾病关联预测。(2)传统图卷积网络往往采用的浅层网络学习非线性特征,无法提取circRNA和疾病的高阶邻域信息和深层特征表示。在特征提取过程中,采用图卷积网络学习circRNA和疾病的非线性特征,忽略了circRNA和疾病的线性特征。针对以上问题,本文提出了基于密集图自动编码器和多特征融合的circRNA-疾病关联预测模型CDA-MSDGAT。CDA-MSDGAT采用密集图卷积网络代替浅层图卷积网络,以密集连接方式提高网络深度,提取circRNA和疾病的深层非线性特征;并使用非负矩阵分解算法提取circRNA和疾病的线性特征;最后融合非线性特征和线性特征用于circRNA-疾病关联预测。综上所述,本文采用相似性核融合算法来融合circRNA和疾病相似性数据,通过非负矩阵分解方法和密集图自动编码器实现了circRNA和疾病的线性特征和深层非线性特征的提取和融合,进一步丰富了特征空间,有效预测了潜在circRNA-疾病关联。与现有方法相比,CDA-MSDGAT可以更好地预测疾病相关的circRNA,为疾病诊断和治疗领域的研究提供有效的靶点信息。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分