多维数据流最大频集挖掘模型和算法
A Model and an Algorithm to Mine Maximal Frequent Itemsets From Multidimensional Data Stream作者机构:北京工业大学计算机学院北京100124
出 版 物:《北京工业大学学报》 (Journal of Beijing University of Technology)
年 卷 期:2010年第36卷第6期
页 面:820-827页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:为了挖掘到有价值的信息,需要挖掘多维数据流上的频繁项目集,因此引入多维项目和多维项目集的概念表示多维数据流上的项目.设计了一种紧凑、压缩的数据结构MaxFP-Tree用于维护多维项目集,并在MaxFP-Tree的基础上设计了挖掘多维数据流上最大频集的增量式更新算法.实验结果表明,设计的挖掘多维数据流中最大频集的模型和算法是高效的.