基于核函数的最大后验概率的分类方法的研究及其应用
作者单位:江南大学
学位级别:硕士
导师姓名:王士同
授予年度:2012年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:人脸识别 特征提取 核函数 Parzen窗 多元高斯分布 多元t分布 高斯噪声 重尾噪声
摘 要:模式识别是人工智能领域的一个重要分支,它是伴随着信息化、科技化的发展而逐步形成的一门学科,在多种场合有着重要应用。模式识别的本质要求就是根据算法完成分类功能。从分类的对象上,分类包括人脸分类和文本分类等。人脸识别技术作为模式识别技术中研究时间长、技术比较成熟的一项,多年来,一直是众多学者研究的热点。以前关于人脸识别技术的研究多数集中在线性识别方法以及对其改进的算法上,取得的效果并不是特别理想。近年来,统计理论和核函数的快速发展极大地促进了人脸识别技术的向前推进,将人脸识别方法定位到统计学中,并在此基础上展开研究。文本分类中的待研究对象通常以显式形式表示,与人脸识别相比,比较简单。分类技术作为模式识别技术中的基础技术,其应用需求广泛,因此,研究分类算法具有重大意义。 本文的研究目的是在分析多分类方法的基础上,提出能够更好的适应样本数据分布特性的新的多分类方法。文中首先阐述了多分类方法的基本理论,指出特征抽取技术对于信息提炼的重要性,其次,针对线性分类方法无法处理样本数据线性不可分情况,引入核函数概念,阐述基于核函数的分类方法理论,最后,提出依据概率密度函数分布情况设计分类器的方法。重点在于:(一)分析非参数估计法中的Parzen窗估计法,提出Parzen窗估计下,基于核函数的最大后验概率分类方法PKMAP,详细阐述了该算法理论以及对于小样本数据的概率密度函数估计的准确性,同时指出其在时间复杂度上的缺点;(二)分析参数估计法中的多元t分布情况,并将其余贝叶斯理论以及核函数相结合,提出多元t分布下基于核函数的最大后验概率多分类方法TKMAP,并在文本数据集和人脸数据集中验证种算法的实验性能;(三)将TKMAP方法用于含重尾噪声点的人脸图像中。在人脸图像中加入五种类型的重尾噪声,以验证TKMAP方法对于重尾噪声的抗噪能力。 本文不仅对分类算法理论和原理做了比较系统和详细的阐述,而且通过在国际文本数据集UCI和人脸数据集Yale和Umist、ORL和BioID上进行了算法验证。UCI数据集和人脸数据集中的实验结果表明,本文提出的方法具有可行性和有效性。