基于核密度估计的分布数据流离群点检测
Finding Outliers in Distributed Data Streams Based on Kernel Density Estimation作者机构:东南大学计算机科学与工程系南京210096
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2005年第42卷第9期
页 面:1498-1504页
核心收录:
学科分类:0810[工学-信息与通信工程] 0808[工学-电气工程] 0839[工学-网络空间安全] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(70371015) 教育部高等学校博士学科点科研基金项目(20040286009)~~
摘 要:基于数据流数据的挖掘算法研究受到了越来越多的重视.针对分布式数据流环境,提出基于核密度估计的分布数据流离群点检测算法.算法将各分布节点上的数据流作为全局数据流的子集,通过分布节点与中心节点的通信,维护基于全局数据流的分布密度估计.各分布节点基于该估计对其上的分布数据流进行离群点检测,从而得到基于全局数据流的离群点集合.对节点之间的交互以及离群点检测算法的细节进行了讨论.通过实验验证了算法的适用性和有效性.