自适应区间配置在关联规则并行采掘中的作用(英文)
Effect of Adaptive Interval Configuration on Parallel Mining Association Rules作者机构:清华大学自动化系北京100084 香港大学计算机科学系
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2000年第11卷第2期
页 面:159-172页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:国家自然科学基金! No.79970 0 5 2 RGC (the Hong Kong Research Grants Council)! (No.338/ 0 6 5 / 0 0 32 )
摘 要:现行的采掘关联规则的并行算法基于经典的层次算法 .该方法在每一次重复扫描数据库时都需要一次同步 ,这种同步运算对于共享内存多处理器并行机来说极大地降低了采掘性能 ,这种低效主要源于对共享的 I/ O通道的竞争 .该文提出了在共享内存多处理机上采掘关联规则的异步算法 APM.在 APM中 ,所有参与计算的处理器能独立地产生备选集和计算支持度 .而且 ,APM所需的扫描数据库的次数比层次方法所需的更少 .该文还提出了一种增强 APM的技术 ,使得该算法的性能对于数据分布更具有鲁棒性 .文中实现了 APM的变种算法 ,还实现了 Apriori的并行版本 Count Distribution算法 .在 SGI Power Challenge SMP并行机上 ,进行了性能分析 ,结果表明所提出的异步算法 APM具有更好的性能和可扩展性 .