基于数据深度的变点识别方法研究
作者单位:天津大学
学位级别:硕士
导师姓名:聂斌
授予年度:2012年
学科分类:120202[管理学-企业管理(含:财务管理、市场营销、人力资源管理)] 12[管理学] 1202[管理学-工商管理] 07[理学] 070104[理学-应用数学] 0701[理学-数学]
摘 要:在工业生产中,统计过程控制(Statistical Process Control, SPC)在质量管理中的重要性已得到了广泛认可,统计过程控制到目前为止是一种重要的监测过程运行状态是否出现异常的方法。我们可以将SPC的实施过程按两个阶段来分:第I阶段,通过对历史数据的分析,提取过程处于受控状态的观测数据,描述稳定运行状态下质量特征值的概率分布特征;第II阶段,根据概率分布参数的估计值,建立控制图并对过程进行实时监控,当控制图中的数据表现出异常的运行模式时发出警报,分析导致异常出现的根本原因,最后采取适当的措施来改进,将过程调整到稳定的运行状态。 在统计过程控制的第I阶段,准确识别运行状态发生漂移的时间点是决定控制效果的关键。现有的变点识别方法大多数针对单一正态分布的数据,而我们得到的产品历史数据会因其产品特性而具有不同的分布类型,鉴于此,本文提出一种以多维空间的数据离心程度作为判定变点规则的思路,通过概率密度轮廓将单一观测值序列转化为多维空间中的数据点,运用数据深度(Data Depth)技术构造特征变量,并建立变点定位规则,识别出较长时间段的符合质量要求的样本数据。通过几组仿真数据,我们将新方法和传统的LRT方法和AHC方法作了对比,仿真性能分析的结果表明新方法能够在不需要假设过程服从正态分布的前提下对变点位置进行精确定位。在最后的比较研中也证明新方法的综合性能表现良好。 本文最后将这种变点识别方法的优点、局限性做了总结,得出一些有用的结论,并对SPC的未来发展做出展望。