一种直接生成频繁项集的分治Apriori算法
A DIVIDE-AND-CONQUER APRIORI ALGORITHM DIRECTLY GENERATING FREQUENT ITEMSETS作者机构:武汉大学计算机学院湖北武汉430000
出 版 物:《计算机应用与软件》 (Computer Applications and Software)
年 卷 期:2014年第31卷第4期
页 面:297-301,326页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:针对Apriori算法的不足,提出基于项数布尔矩阵的改进算法MPIN_Apriori。改进算法运用分治思想将数据集分段处理,使用事务项数进行矩阵压缩并利用向量交运算和先验剪枝直接生成局部频繁k-项集,最终合并为全局频繁k-项集。该算法从根本上改进了Apriori算法频繁迭代的流程,避免了连接运算而且极大减轻了内存负担。实验结果表明在进行大型数据库频繁项集挖掘时其效率明显高于Apriori算法,而且对分布式数据挖掘有参考价值。