一种改进的数据流最大频繁项集挖掘算法
An improved algorithm for mining maximal frequent itemsets over data streams作者机构:江西理工大学信息工程学院江西赣州341000
出 版 物:《计算机工程与科学》 (Computer Engineering & Science)
年 卷 期:2014年第36卷第5期
页 面:963-970页
核心收录:
学科分类:0810[工学-信息与通信工程] 08[工学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0835[工学-软件工程] 081002[工学-信号与信息处理]
主 题:数据挖掘 数据流 界标窗口 最大频繁项集 窗口衰减支持数
摘 要:提出了一种基于DSM-MFI算法的改进算法DSMMFI-DS算法,它首先将事务数据按一定的全序关系存入DSFI-list列表中;然后按排序后的顺序存储到类似概要数据结构的树中;接着删除树中和DSFI-list列表中的非频繁项,同时删除窗口衰退支持数大的事务项;最后采用自顶向下和自底向上的双向搜索策略来挖掘数据流的最大频繁项集。通过用例分析和实验表明,该算法比DSM-MFI算法具有更好的执行效率。