压缩UF-tree挖掘不确定数据频繁项
Mining frequent items in uncertain dataset using compressed UF-tree作者机构:桂林理工大学信息科学与工程学院广西桂林541004
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2014年第31卷第3期
页 面:716-719页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家科技支撑计划资助项目(2008BAK50B02-02 2011BAD32B02)
摘 要:针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创建新的分支,叶节点保存当前事务编号。构建单项数据项的概率向量,搜索树分支产生候选项,通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析,压缩UF-tree算法可行且更高效。