使用RNN的基于距离的孤立点检测
Reverse Nearest Neighbors in Distance-based Outlier Detection作者机构:西南林业大学云南昆明650224
出 版 物:《信息与电脑》 (Information & Computer)
年 卷 期:2017年第29卷第8期
页 面:81-82页
学科分类:0839[工学-网络空间安全] 08[工学]
基 金:基金项目:西南林业大学 数据挖掘在森林资源质量评价体系中的应用 2013Y117
摘 要:孤立点检测是数据挖掘中一个非常重要的应用,被用于发现隐藏在大数据集中的意料之外的和不寻常的模式。该方法通常被用于欺诈检测、时间序列的监测、入侵检测和医学检测中。现有的算法大部分都基于监督的和非监督的学习,其余的使用半监督的方法。然而在大部分实际应用中,没有足够的经过标记的数据用于训练并且经过正面标记的例子也很少。孤立点检测目前正受到来自维度灾难的各种高维挑战。目前的主流观点认为高维数据中的距离度量难以度量和计算。这对基于距离的孤立点检测方法构成了巨大的障碍,因为无法标记所有的点。本文提出一个新的基于距离的算法,通过与经典的KNN方法进行比较,表明使用反最近邻的非监督学习的基于距离的孤立点检测是很有效的。