基于混合近邻局部分布差异的离群点检测算法
Outlier Detection Based on Local Distribution Difference of Hybrid Nearest Neighbors作者机构:西安交通大学软件学院西安710049 西安交通大学网络空间安全学院西安710049
出 版 物:《计算机与数字工程》 (Computer & Digital Engineering)
年 卷 期:2024年第52卷第2期
页 面:301-306页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(编号:61902306) 中国博士后项目(编号:2019TQ0251,2020M673439)资助
摘 要:离群点检测作为数据挖掘领域的重要任务,其目的是从表示事件或对象行为的数据中找出不一致数据。目前大部分传统的无监督离群点检测算法,如基于距离或密度的方法,识别多维度空间离群数据时都存在因维度诅咒导致检测精度衰退的问题。论文提出了基于混合近邻的离群点检测算法,该算法以数据项的混合近邻作为新的局部影响空间,以双向共享近邻和欧式距离重新定义了数据项的相似度计算方式,通过对比数据项与其局部影响空间中样本的平均局部分布差异衡量数据的局部离群程度,从而识别离群点。在合成和真实数据集上和其他同类算法的对比实验结果证明,该算法在离群点检测方面具有一定的提高。