基于分布数据库的快速关联规则挖掘算法
A Fast Algorithm for Mining Association Rules in Distributed Databases作者机构:南京审计学院 东南大学计算机科学与工程系南京210096 东南大学计算机科学与工程系 江苏大学计算机科学与通信工程学院
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2006年第42卷第4期
页 面:165-167,194页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(编号:70371015) 江苏大学科研启动基金项目(编号:04KJD001)
主 题:频繁项目集 分布式关联规则挖掘 数据挖掘 布尔关联规则
摘 要:关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些或、与、异或等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。