基于高斯模型的异常检测算法
作者单位:中国矿业大学
学位级别:硕士
导师姓名:夏战国
授予年度:2017年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:近几年来,随着数据样本的增多,数据多样性的增加,异常检测问题得到越来越多的关注。异常检测是一种特殊的二类分类问题,在处理异常检测问题中,需要处理两种类别问题,每种类别都有特殊的含义,它们分别被称为目标类和异常类。而现实数据往往是由目标类数据构成的数据集,极少存在有异常类的情况,这被称为类不均衡现象,也是异常检测问题的特殊之处。在不同领域,研究人员使用不同的策略来解决异常检测问题,本文结合高斯模型方法,提出了基于高斯模型异常检测算法。首先,提出一种基于高斯过程模型的异常检测算法(GpPM)。该算法结合高斯过程回归的零均值先验知识,选取RBF作为核函数,进行高斯过程模型的训练,将后验概率的均值、后验概率的方差以及后验概率作为异常检测的评价指标,并获得相应的评价指标阈值。最后,通过人工仿真数据集以及多个UCI数据集验证了GpPM算法的有效性。其次,提出一种基于高斯混合模型的异常检测算法(LVBGMMS)。该算法针对EM算法以及贝叶斯模型选择方法的弊端进行改进,结合基于成分分裂的增量学习方法,采用局部贝叶斯模型选择方法进行高斯混合模型训练,并获得相应的上下界阈值作为评价指标。最后,通过人工仿真数据集以及KDD99数据集验证了LVBGMMS算法的有效性。最后,本文设计并实现了基于高斯混合模型的异常检测原型系统,该系统采用本文提出的基于高斯过程模型的异常检测算法(GpPM)和基于高斯混合模型的异常检测算法(LVBGMMS),很好地满足不同用户对各算法功能的需求。