咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于密度偏倚抽样的局部距离异常检测方法 收藏

基于密度偏倚抽样的局部距离异常检测方法

Anomaly Detection Algorithm Based on the Local Distance of Density-Based Sampling Data

作     者:付培国 胡晓惠 FU Pei-Guo HU Xiao-Hui

作者机构:中国科学院大学北京100049 天基综合信息系统重点实验室(中国科学院软件研究所)北京100190 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2017年第28卷第10期

页      面:2625-2639页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(U1435220) 国家高技术研究发展计划(863)(2012AA011206) 

主  题:异常检测 局部异常系数 局部距离 密度偏倚抽样 SLDOF算法 

摘      要:异常检测是数据挖掘的重要研究领域,当前基于距离或者最近邻概念的异常数据检测方法,在进行海量高维数据异常检测时,存在运算时间过长的问题.许多改进的异常检测方法虽然提高了算法运算效率,然而检测效果欠佳.基于此,提出一种基于密度偏倚抽样的局部距离异常检测算法,首先利用基于密度偏倚的概率抽样方法对所需检测的数据集合进行概率抽样,之后对抽样数据利用基于局部距离的局部异常检测方法,对抽样集合进行局部异常系数计算,得到的异常系数既是抽样数据的局部异常系数,又是数据集的近似全局异常系数.然后对得到的每个数据点的局部异常系数进行排序,异常系数值越大的数据点越可能是异常点.实验结果表明,与已有的算法相比,该算法具有更高的检测精确度和更少的运算时间,并且该算法对各种维度和数据规模的数据都具有很好的检测效果,可扩展性强.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分