数据流中频繁闭项集的近似挖掘算法
An Algorithm to Approximately Mine Frequent Closed Itemsets from Data Streams作者机构:北京工业大学计算机学院北京市多媒体与智能软件重点实验室北京100022
出 版 物:《电子学报》 (Acta Electronica Sinica)
年 卷 期:2007年第35卷第5期
页 面:900-905页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金重大项目(No.60496322 60496327)
摘 要:在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘频繁闭项集,其中一个典型的工作就是Moment算法.本文提出了一种数据流中频繁闭项集的近似挖掘算法A-Moment.它采用衰减窗口机制、近似计数估计方法和分布式更新信息策略来解决Moment算法中过度依赖于窗口和执行效率低等问题.实验表明,该算法在保证挖掘精度的前提下,可以比Moment获得更好的效率.