面向数据流的多层Count-Min概要数据结构
Hierarchical Count-Min Sketch Data Structure for Data Streams作者机构:北京理工大学网络信息中心北京100081 河南理工大学计算机科学与技术学院焦作454000
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2007年第33卷第14期
页 面:20-23页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:下一代互联网中日交流合作基金资助项目"IPv6-CJ"
摘 要:构造了多层Count-Min概要数据结构来概括流数据中的层次结构。通过定义多层数据域U*上两两相互独立的异或哈希函数族,将数据流元组映射到L×D×W的三维计数数组,L是层次个数,D是从哈希函数族中均匀随机选取的哈希函数个数,W是哈希函数的值域。基于该结构,利用广度优先查询策略,查找多层频繁项集和估计多层频繁项值。实验表明,该结构在更新时间、存储空间和估计精度方面比直接堆叠多个Count-Min结构有较大的提高。