基于语义与全局双重注意力机制的长链非编码RNA-疾病关联预测模型
Long non-coding RNA-disease association prediction model based on semantic and global dual attention mechanism作者机构:桂林理工大学信息科学与工程学院广西桂林541006 广西嵌入式技术与智能系统重点实验室(桂林理工大学)广西桂林541006
出 版 物:《计算机应用》 (journal of Computer Applications)
年 卷 期:2023年第43卷第7期
页 面:2125-2132页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(62166014,62162019) 广西自然科学基金资助项目(2020GXNSFAA297255)
主 题:关联预测 异构网络 元路径 双重注意力 图卷积网络 长链非编码RNA
摘 要:针对现有长链非编码RNA(lncRNA)-疾病关联预测模型在综合利用异构生物网络的交互、语义信息上存在局限性的问题,提出一种基于语义与全局双重注意力机制的lncRNA-疾病关联预测模型(SGALDA)。首先,基于相似性和已知关联构建一个lncRNA-疾病-微小RNA(miRNA)异构网络,并基于消息传递类型设计特征提取模块来提取和融合异构网络上同质、异质节点的邻域特征,以捕捉异构网络上的多层面交互关系。其次,基于元路径将异构网络分解为多个语义子网络,并分别在各个子网络上应用图卷积网络(GCN)来提取节点的语义特征,以捕捉异构网络上的高阶交互关系。然后,基于语义与全局双重注意力机制融合节点的语义和邻域特征,以获得更具代表性的节点特征。最后,利用lncRNA节点特征和疾病节点特征的内积运算重建lncRNA-疾病关联。5折交叉验证结果显示,SGALDA的受试者工作特征曲线下面积(AUROC)为0.9945±0.0002,PR曲线下面积(AUPR)为0.9167±0.0011,在所有对比模型中均为最高,验证了SGALDA良好的预测性能。对乳腺癌、胃癌的案例研究进一步证实了SGALDA识别潜在lncRNA-疾病关联的能力,说明SGALDA有潜力成为一种可靠的lncRNA-疾病关联预测模型。