挖掘不确定数据的最大频繁项集
Mining maximal frequent itemsets in uncertain data作者机构:贵州大学现代制造技术教育部重点实验室贵州贵阳550003
出 版 物:《华中科技大学学报(自然科学版)》 (Journal of Huazhong University of Science and Technology(Natural Science Edition))
年 卷 期:2015年第43卷第9期
页 面:29-34页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家科技支撑计划资助项目(2012BAF12B14) 贵州省重大科技专项资助项目(6018 6019) 贵州省科学技术基金资助项目(2196) 贵州省工业攻关项目(3004)
主 题:数据挖掘 不确定数据 频繁项集 最大频繁项集 频繁模式树 遗传算法
摘 要:针对不确定数据频繁项集挖掘效率低和准确度不高的问题,提出了一种基于改进的频繁模式树(FPtree)和遗传算法(GA)挖掘不确定数据概率频繁项集的方法,即UFPGA(基于频繁模式树和遗传的挖掘算法).该算法根据不确定数据的构成特征,改进频繁模式树方法挖掘不确定数据频繁项集,采用缩小变异空间和增加育种算子的遗传算法搜索最大频繁项集,收缩了搜索范围,提高了挖掘效率.实验结果表明:该方法在时间复杂度方面有很好的优越性,对大规模的不确定数据挖掘提供了一种有效的技术手段.