基于组合局部孤立点的噪声处理算法
A noise removal algorithm based on combined local outlier factors作者机构:北京航空航天大学经济管理学院北京100191 北京工商大学计算机与信息工程学院北京100048
出 版 物:《中国科技论文》 (China Sciencepaper)
年 卷 期:2013年第8卷第7期
页 面:672-678页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:高等学校博士学科点专项科研基金资助项目(20091102120014)
主 题:模式识别 类别噪声 属性噪声 局部孤立系数 异常点检测
摘 要:LOF(Local Outlier Factor)算法是基于密度的典型孤立点识别算法,在实践中被广泛用于检测属性噪声。然而,LOF算法没有综合考虑类与类、类与整体之间的信息,因而对类别噪声识别欠佳。CLOF(Combined Local Outlier Factors)是在LOF算法的基础上提出一种基于组合局部孤立系数的类别噪声处理算法。算法通过lofa、lof1、lof0三个局部孤立系数值,首先在整体数据集上剔除属性噪声,其次综合利用整体和局部信息,通过3个lof值之间的关系来识别类别噪声,并更正其类标签。在仿真数据集和UCI数据集上的实验结果表明,CLOF算法能够同时有效识别类别噪声和属性噪声,提高分类器的分类精度,对具有类重叠的复杂数据处理效果尤佳。