再生核希尔伯特空间中的函数型支持向量机及其应用
作者单位:江西财经大学
学位级别:硕士
导师姓名:刘小惠
授予年度:2022年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:函数型数据分类 线性函数型支持向量机模型 再生核希尔伯特空间 最优解 心电图
摘 要:随着当今科学技术的不断进步,人们获取数据的数量与形式也得到了很大的发展,函数型数据这种时域或地域上的一维或多维函数便越来越广泛地被人们应用于金融、经济、医学、电子商务等领域。函数型数据的分类问题与人类传统生活息息相关。例如,通过借助计算机获得的眼底照OCT图像数据辅助诊断全球第二大致盲眼病——青光眼,利用近红外光的吸收度值对碎肉样品的脂肪含量进行研究等。近年来,心血管疾病的发病率逐年上升,想要有效地预防这类疾病,就需要通过心电图对病人进行初步确诊。然而,在通常情况下,由医学领域的专家对心电图进行人工判别不仅费时费力也很容易出错。因此,利用计算机辅助诊断心电图是十分重要的。利用计算机辅助诊断患者心电图是否存在异常情况实则就是一个函数型数据的二分类问题。但当我们试图借用经典分类器对函数型数据进行分类时,往往会遇到一些瓶颈。其原因在于函数型数据本质上是无限维的,而大多数算法都是用来处理低维向量的,现有的经典分类器由于维数灾难而不能直接应用或性能较差。为了解决这一问题,本文首先构建出了一个线性函数型支持向量机模型,并基于一个定义了再生核K的再生核希尔伯特空间H(K),通过寻找正则化经验风险函数的极小值来估计模型中的未知参数;尔后,本文针对三种不同设置的有限样本进行了随机数值模拟,结果表明它们均具有良好的有限样本性质;最后,本文将该模型应用于心电图数据与光谱数据,结果表明本文所提出的线性函数型支持向量机效果良好且具有一定实用性。支持向量机在有限维数据的分类问题中已经得到了广泛的应用,但其在函数型数据分类问题中的应用却并不多见。现有文献的研究成果大多基于已降维处理后的函数型数据,即对提取出的特征向量构造支持向量机,而没有保留原始数据的完整性;或是基于希尔伯特空间简单地提到运用支持向量机对函数型数据进行分类,而没有对模型的具体形式以及参数估计等问题进行深入地讨论。因此,本文针对于上述问题进行了探讨并完善了现有理论研究的不足。本文构建出了一个线性函数型支持向量机模型,即通过借助核技巧将函数型数据投影到一个特定的方向上,然后使用支持向量机对其进行分类。其中,投影方向是通过最小化支持向量机分类器中包含特定损失函数的经验风险函数来识别的,而该风险函数则建立在再生核希尔伯特空间上,目前尚未有文献基于再生核希尔伯特空间构建出函数型支持向量机模型。此外,本文借助一些定理,推导出了估计量的表达形式用于求出未知参数的最优解,将该无穷维最小化问题转换成为了一个有限维问题,对现有函数型数据的分类方法进行了扩展与创新。如今,函数型数据已被广泛应用于各个领域,由于对函数型数据进行分类之后可以从中提取有用的信息,其分类问题也成为科学研究中的一项重要任务。因此,通过利用泛化能力很强的支持向量机进一步深入研究和扩展函数型数据的高效分类方法具有一定的现实意义。本文所提出的线性函数型支持向量机能够避免过拟合问题,并具有支持向量机分类器的优良特性。此外,再生核希尔伯特空间的使用也使人们能够控制所估计投影方向的粗糙度。因此,与传统的函数型逻辑回归和中心分类器相比,本文所提出的分类器可以提高预测精度。