基于趋势性表示的时间序列异常检测
作者单位:中国矿业大学
学位级别:硕士
导师姓名:闫秋艳
授予年度:2023年
学科分类:02[经济学] 07[理学] 08[工学] 070103[理学-概率论与数理统计] 0810[工学-信息与通信工程] 0202[经济学-应用经济学] 020208[经济学-统计学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0835[工学-软件工程] 0714[理学-统计学(可授理学、经济学学位)] 081002[工学-信号与信息处理] 0701[理学-数学]
主 题:趋势 SPD矩阵 自编码器 自适应阈值 时间序列异常检测
摘 要:时间序列异常检测是时间序列挖掘的重要研究内容之一。时间序列异常检测任务的应用场景通常较为复杂,如井下安全生产监测系统产生的大量灾害监测数据,具有复杂的时间依赖性和空间依赖性,且数据中包含的趋势性模式是重要的灾害前兆,此类模式的识别对于灾害预警和防治具有重要意义。传统多维时间序列异常检测无法将趋势性特征及多维序列之间的时间依赖性和空间关联性与异常检测任务进行融合,因而在此类问题中的应用效果欠佳。针对上述问题,本文针对多维时间序列数据中的趋势性模式进行特征表示,并基于此特征实现自适应、无监督异常检测,具体工作如下:(1)针对传统多维时间序列异常检测未将数据趋势特征和序列的时间、空间依赖性相融合的问题,提出了一种基于多尺度趋势及SPD(Symmetric Positive Definite)表征的自编码异常检测方法(Trend SPD Auto Encoder Anomaly Detection method,TSAD)。首先,采用多尺度趋势特征表示多维时间序列的趋势性模式,以该特征为参数输入核函数生成保持正定性的SPD矩阵,以表达多维时序数据构造的复杂空间结构。然后,设计了保持SPD矩阵特性的SPD-AE网络,学习数据的潜在表示,并定义矩阵重构误差作为损失函数和异常分数进行异常检测。在公测数据和自采冲击地压监测数据(MINE)上进行的验证实验表明,本文方法在WADI数据集和MINE数据集上取得了最好的F1值,在WADI数据集上效果比GDN方法提升了9.8%,在MINE数据集上效果比MSCRED方法提升了2.9%。(2)针对原始多维时间序列包含大量缺失值会影响异常检测任务的准确率,并且使用根据经验或枚举方法使用预定义阈值不利于自动化异常检测问题,在TSAD模型的基础上提出了基于趋势特征的时间序列自适应阈值异常检测方法(TSAD*)。首先,采用随机森林方法对原始传感器数据进行缺失值填充,获得完整多维时间序列数据。然后,定义适用于SPD矩阵的对数欧几里得度量为重构误差,采用验证集上最大误差的平均值作为阈值进行异常检测。在公测数据和自采冲击地压监测数据(MINE)上进行的验证实验表明,随机森林方法填充缺失值具有比均值填充更优的异常检测效果,在SWAT、WADI、SMD和MINE数据集上,TSAD*的F1值相较于TSAD分别提升了1.22%、1.93%、1.94%和0.7%。(3)针对多维时间序列异常检测的现实应用,结合本文提出的TSAD*方法,以矿井灾害监测监控系统为背景,设计并实现了一个多维时间序列异常检测原型系统。系统从井下获取瓦斯、声发射、电磁等数据,使用本文提出的TSAD*模型进行数据处理和异常检测,将异常检测结果进行可视化展示,系统实时检测井下灾害异常情况,并对异常事件进行分类查询和综合查询。