稀疏数据源频繁模式挖掘并行算法
Parallel Algorithms of Mining Frequent Patterns from Sparse Data Source作者机构:天津大学计算机科学与技术学院天津300072 天津职业技术师范大学信息技术工程学院天津300222
出 版 物:《天津大学学报》 (Journal of Tianjin University(Science and Technology))
年 卷 期:2011年第44卷第4期
页 面:353-358页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:天津市应用基础及前沿技术研究计划重点资助项目(08JCZDJC19700)
主 题:频繁模式挖掘 稀疏数据源 面向视图的分布式集群计算 视图划分 链表
摘 要:针对频繁模式挖掘中一类特殊的稀疏数据源,设计了一种链表结构体FI-list,并据此提出一个并行搜索频繁项集(PMFSD)的算法.该方法基于一个分布式共享内存系统——面向视图的分布式集群计算(VODCA)而设计.详细描述了链表结构体FI-list的设计和构建过程,论述了在VODCA上挖掘稀疏数据源频繁模式的问题中,视图的划分依据及划分结果,讨论了算法实现的动态任务分配策略.实验结果证明了PMFSD算法的正确性和有效性.