一种面向蛋白质复合体检测的图聚类方法
A Graph Clustering Method for Detecting Protein Complexes作者机构:山西大学计算机与信息技术学院太原030006 计算智能与中文信息处理教育部重点实验室(山西大学)太原030006
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2015年第52卷第8期
页 面:1784-1793页
核心收录:
学科分类:0810[工学-信息与通信工程] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 0839[工学-网络空间安全] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(61432011 61272004) 山西省自然科学基金项目(2011011016-1) 教育部高等学校博士学科点专项科研基金项目(200801081017)
主 题:流模拟 图聚类 软聚类 蛋白质互作用网络 蛋白质复合体
摘 要:蛋白质互作用(protein-protein interaction,PPI)网络是广泛存在的一类复杂生物网络,其网络拓扑特征与功能模块分析密切相关.图聚类是对复杂网络进行分析和处理的一种重要计算方法.传统的PPI网络中蛋白质复合体检测算法通常对网络图中的对象进行硬划分,而寻找网络中的重叠簇的软聚类算法已成为当前研究热点之一.现有的软聚类算法较少关注寻找网络中具有重要生物意义的小规模非稠密簇.对此,基于网络中结点邻域给出了边关联强度的度量方法,并在此基础上提出了一种基于流模拟的PPI网络中复合体检测的图聚类(flow-simulation graph clustering,F-GCL)算法,该算法可以在快速发现PPI网络中的重叠簇的同时找到小规模非稠密簇;同时,与MCODE(molecular complex detection),MCL(Markov clustering),RNSC(restricted neighborhood search clustering)和CPM(clique percolation method)算法在6个酿酒酵母PPI网络上进行比较,该算法在F-measure,Accuracy,Separation方面表现了较好的性能.