基于频繁密度分布模式的不确定数据流查询方法
Query processing on uncertain data stream based on frequency density distribution pattern作者机构:哈尔滨工程大学计算机科学与技术学院黑龙江哈尔滨150001 审计署计算机技术中心北京100073
出 版 物:《哈尔滨工程大学学报》 (Journal of Harbin Engineering University)
年 卷 期:2018年第39卷第6期
页 面:1052-1058页
核心收录:
学科分类:08[工学] 0810[工学-信息与通信工程] 0817[工学-化学工程与技术] 0807[工学-动力工程及工程热物理] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0827[工学-核科学与技术] 0802[工学-机械工程] 0703[理学-化学] 0835[工学-软件工程] 0825[工学-航空宇航科学与技术] 081002[工学-信号与信息处理] 0811[工学-控制科学与工程] 0801[工学-力学(可授工学、理学学位)]
主 题:不确定性 数据流 相似性查询 非参数估计 数据挖掘 马尔科夫
摘 要:针对当前不确定数据流相似性查询问题中不确定对象建模不准确的问题,提出了一种面向不确定数据流的相似性查询方法 HB-UTS。利用非参数估计方法对不确定数据流中的对象建模,得到不确定对象的密度函数。通过谱聚类方法挖掘密度函数的频繁模式,将挖掘后的模式抽象为语义表示的不确定数据流序列。在相似性查询阶段,通过高阶Markov的状态转移矩阵模型构建不确定数据流的索引结构,它在记录不确定数据流存储地址的同时还记录序列元素的存储概率,可有效提高数据流的分步输入查询效率。本文进行了真实与仿真相结合的方法,通过在随机化处理后的真实数据集上的实验以及与其他相似性查询方法的比较,验证了HB-UTS在处理大规模不确定数据流时较好处理能力以及实施效果。