从基因表达数据中有效挖掘差异共表达双聚类——DiCluster算法
DiCluster approach: effective mining differential co-expression bicluster in gene expression data作者机构:西北工业大学计算机学院计算机软件与理论系西安710129
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2012年第29卷第11期
页 面:4087-4092页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"973"计划资助项目(2012CB316203)
摘 要:双聚类是一种可以同时在基因和条件两个维度上分析基因表达数据的方法,它可以找出在部分条件下具有相似表达趋势的基因。已有的方法都是从一个数据集中挖掘双聚类。从生物意义上分析,从不同基因表达数据集中挖掘差异表达双聚类可以发现具有生物意义的转录因子等信息。因此,提出一种挖掘不同数据集上差异共表达双聚类的算法——DiCluster。该算法采用深度优先基因扩展方法,并引入了剪枝策略,有效挖掘最大差异表达双聚类。实验结果表明,DiCluster不仅比已有算法具有更高的效率,而且挖掘出的结果具有更好的统计学和生物学意义。