减少候选项集的数据流高效用项集挖掘算法
High utility itemsets mining algorithm of data stream with reducing candidate itemsets作者机构:新乡学院计算机与信息工程学院河南新乡453003 河南大学计算机与信息工程学院河南开封475004
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2017年第34卷第11期
页 面:3379-3383页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:河南省科技厅软科学研究计划资助项目(152400410345) 河南省科技厅科技攻关资助项目(172102210445) 河南省教育厅资助项目(15A520093)
主 题:大数据 数据流 高效用项集 模式挖掘 模式增长 候选模式
摘 要:大数据环境下高效用项集挖掘算法中过多的候选项集极大地降低了算法的时空效率,为此提出了一种减少候选项集的数据流高效用项集挖掘算法。通过数据流中当前窗口的一次扫描建立一个全局树,并降低全局树中头表入口与节点的冗余效用值。基于全局树生成候选模式,基于增长算法降低局部树的候选项集效用,从候选模式中选出高效用模式。基于真实数据流的实验结果表明,算法的时空效率与内存占用比均优于其他数据流的高效用模式挖掘算法。