基于属性关联及匹配差异度的数据流异常检测
Outlier Detection Model for Data Streams Based on Attribute Associations and Match Difference Degree作者机构:浙江工商大学计算机与信息工程学院浙江杭州310018 浙江工商大学现代商贸研究中心浙江杭州310018
出 版 物:《西南交通大学学报》 (Journal of Southwest Jiaotong University)
年 卷 期:2013年第48卷第1期
页 面:107-115页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(71071141) 浙江省自然科学基金重点项目(Z1091224) 教育部博士点基金资助项目(20103326110001)
摘 要:为解决类别属性数据流异常点检测问题,针对事务数据流环境,提出了基于属性关联及匹配差异度的数据流异常检测模型AAMDD(attribute associations and match difference degree).AAMDD模型离线构建一个关联规则库,并对其进行增量式更新.同时,利用时间敏感型滑动窗口(time-sensitive sliding windows,TimeSW)维护数据流数据,每经过一个时间跨度,就将当前窗口中每条数据包含的项集与关联规则库进行匹配,计算匹配差异度,根据匹配差异度的不同在线检测异常点.此外,给出了与AAMDD模型相对应的算法AAMDD-algorithm.实验结果表明,AAMDD-algorithm比FODFP-Stream算法的效率和检测精确度分别平均提高了37.43%和5.51%,并且AAMDD-algorithm的查全率保持在77%以上,可用于事务型数据流异常检测.