大规模EST序列聚类的并行算法研究进展
Parallel algorithms of large-scale EST clustering:current progress作者机构:军事医学科学院卫生勤务与医学情报研究所北京100850 军事医学科学院放射与辐射医学研究所北京100850 国防科技大学并行与分布处理国防科技重点实验室长沙410073
出 版 物:《军事医学科学院院刊》 (Bulletin of the Academy of Military Medical Sciences)
年 卷 期:2006年第30卷第6期
页 面:591-595页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点基础研究发展计划("973"计划)(2003CB715900) 国家高技术研究发展计划("863"计划)(2002AA234021) 国家自然科学基金重大研究计划(90208017) 并行与分布处理国防科技重点实验室基金项目(51484050304JB4401) 北京市科技新星计划A类(2005A44) 军事医学科学院科技创新启动基金(0401001 0402013)资助
摘 要:EST是携带有表达基因部分遗传信息的cDNA片段,EST聚类是将来自同一个基因的具有重叠部分的EST整合到单一的类中,是进行后续基因表达数据分析的必要步骤。传统的串行聚类方法的计算复杂度高,对内存要求大,不适于进行大规模聚类计算。本文主要介绍了EST聚类的并行处理方式、软硬件支持环境,适用于大规模EST聚类的并行算法和软件,比较了几种现有软件的算法、计算速度和内存要求等,并讨论了现有大规模聚类算法的优缺点。