树-投影关联规则挖掘方法的水平优化与搜索策略研究
Research on Horizontal Optimization and Search Strategy for the Mining of Association Rules Based on TreeProject作者机构:重庆大学计算机学院重庆400044
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2004年第41卷第6期
页 面:946-955页
核心收录:
学科分类:0810[工学-信息与通信工程] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 0839[工学-网络空间安全] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目 ( 60 2 710 19) 教育部博士点基金项目 ( 2 0 0 2 0 6110 0 7) 重庆大学骨干教师基金项目 ( 7164 110 3 8)
摘 要:基于树 -投影的TreeProject关联规则挖掘算法有效解决了现有各种算法在数据量过大时会失效的问题 通过对该算法及相关算法的研究 ,发现在现有这类算法中存在冗余投影 ,为此提出的水平优化策略通过消除这种冗余投影 ,既可减少树 -投影的搜索空间 ,加快频繁项的挖掘 ;还可减少树 -投影算法需要的内存空间 ,克服了原有树 -投影算法对内存要求较大的不足 ;该优化策略包括挖掘时的合并策略和挖掘后的生成策略两大部分 此外 ,冗余投影的判断 ,可从投影数据库T间的关系简化为相应事务编号数据库Tid间的关系 ,这种简化极大减少了判断的计算量 ,而且可用于投影 ,从而使得进行水平优化无需增加额外开销 基于水平优化策略的HOPTreeProject算法从时间和空间上都对现有的树-投影算法有很大改进 实验结果表明 。