基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法
Fast Algorithm for Mining Association Rules Based on Vertically Distributed Data in Large Dense Databases作者机构:空军雷达学院预警监视情报系武汉430019
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2011年第38卷第4期
页 面:216-220页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:CARMA算法 DAG diffset差集 垂直数据分布 稠密数据库
摘 要:为进一步解决对大型事务数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁的问题,给出了一种基于垂直数据分布的改进关联规则挖掘算法,称为VARMLDb算法。该算法首先有效地把数据库分为内存可以满足要求的若干划分,然后结合有向无环图和垂直数据形式diffset差集来存储和计算频繁项集,极大地减少了存储中间结果所需的内存大小,解决了传统垂直数据挖掘算法对稠密数据库挖掘效率低下的问题,使该算法可有效地适用于大型稠密数据库的关联规则挖掘。整个算法吸取CARMA算法的优势,只需扫描两次数据库便可完成挖掘过程。实验结果表明该算法是正确的,在大型稠密数据库中,VARMLDb算法具有较高的执行效率。