基于FC-tree的频繁闭项目集挖掘算法
Algorithm Based on FC-tree for Mining Frequent Closed Itemsets作者机构:辽宁师范大学计算机与信息技术学院大连116029 辽河油田锦州工程技术处凌海121209
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2008年第35卷第9期
页 面:149-152,164页
核心收录:
学科分类:080903[工学-微电子学与固体电子学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学]
基 金:国家自然科学基金项目(60603047 60703068) 辽宁省自然科学基金 辽宁省教育厅高等学校科研基金 大连市优秀青年科技人才基金
主 题:频繁项目集 频繁闭项目集 最小频繁闭项目集 最大频繁闭项目集 FC-tree(频繁闭模式树)
摘 要:目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,但这类算法会产生巨大的候选集并且重复扫描数据库。本文针对这一问题,给出了一种基于FC-tree的频繁闭项目集挖掘算法Max-FCIA,该算法将频繁项目集存储在哈希表中,节省了程序的搜索时间。此外,利用广度优先搜索和有效的剪枝策略,大大限制了候选项目集的生成,缩小了搜索空间从而提高了程序的性能。实验结果表明该算法是快速有效的。