用于基因芯片数据分析的模块性图聚类方法
Modularity-Based Graph Clustering for Analysis of Gene Microarray Data作者机构:华南理工大学生物科学与工程学院广东广州510006
出 版 物:《华南理工大学学报(自然科学版)》 (Journal of South China University of Technology(Natural Science Edition))
年 卷 期:2013年第41卷第12期
页 面:101-106页
核心收录:
学科分类:08[工学] 09[农学] 0901[农学-作物学] 0836[工学-生物工程] 090102[农学-作物遗传育种]
基 金:教育部中国网格计划生物信息网格平台子项目(B12137040130)
摘 要:图聚类是一种重要的聚类算法,可有效应用于蛋白质作用网络和芯片数据聚类等领域.文中针对现有基因芯片数据图聚类方法的不足,提出了一种基于模块性指标和子图平滑度的全局图聚类方法.为防止算法陷入局部最优解,引入子图平滑度的定义,打散每次聚类结果中产生的平滑度较低的子图,再对得到的单节点进行下一次聚类,经多次迭代后得到全局最优的聚类结果.采用一组基因组表达数据,将该方法和其他4种常用聚类方法(经典图聚类、k均值、SOM及Fuzzy算法)进行比较,结果表明:该方法在聚类过程中的平均类间重叠度和FOM 值总体上优于其他4种算法,在将数据集分类到最佳聚类数39时,其FOM 值分别比上述4种方法低28.41%、19.21%、9.84%和24.67%;其分类准确度高于Fuzzy法和SOM算法,算法执行效率则与SOM算法相近,比Fuzzy法高5.94%.