轨道动检数据异常检测及缺失数据插补算法研究
作者单位:北京交通大学
学位级别:硕士
导师姓名:尹辉
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:动检数据 异常检测 数据插补 自编码器 生成对抗网络
摘 要:轨道动检数据是由综合检测车定期对高速铁路轨道结构进行动态检测而得到的,是一种典型的由多传感器检测数据组成的多维时间序列数据,具有多维、异构以及影响因素复杂等特点。利用数据挖掘技术对动检数据进行深入分析研究,不仅对于及时掌握轨道安全服役状态,研究其演化规律,进而为养护维修工作提供技术支撑,保证安全运营具有重要实际意义,而且由于动检数据序列具有含多种噪声和异常、不同属性之间存在复杂的隐性关联、数据样本类别极度不平衡等特点,利用其开展时序数据分析研究也具有重要的理论意义。本文主要针对轨道动检数据的异常检测和缺失值插补展开研究,首先开展动检数据异常检测,提出结合自适应融合模块与自编码器的动检数据异常检测方法。然后针对传感器设备故障、人为错误或者环境因素导致的数据缺失,开展缺失数据插补算法研究。本文的主要工作及研究内容包括:(1)针对动检数据存在类别不平衡以及多维之间存在复杂关联关系的挑战,提出一种结合自编码器和自适应融合模块的无监督动检数据异常检测方法(Adaptive TCN-GRU Auto-Encoder,ATGAE)。该方法利用加噪模块Dropout来加强模型对噪声数据的鲁棒性,设计了栈式门控循环单元Stacked_GRU和时域卷积网络TCN的编码器,在时间步上通过构建短期依赖关系和长期依赖关系增强模型的泛化能力,特别地,设计了自适应融合模块实现潜在表征的有效融合,利用栈式门控循环单元网络和全连接网络进行特征解码,从而实现异常检测。本文在高铁真实动检数据集上构建了对比实验和消融实验,实验结果表明本文提出的ATGAE模型在检测性能和鲁棒性方面均优于对比模型,研究成果为实际工程应用提供了一种有效的方法。(2)动检数据的采集过程受环境、天气等多种复杂因素影响,导致采集数据存在缺失情况,针对此问题,本文提出了基于生成对抗网络和GRU-TP的动检缺失数据插补方法(Gated Recurrent Unit based on Time and Position-Generative Adversarial Network,GRU-TP-GAN)。本方法从多维数据的时空关联性出发,将缺失值插补的问题视为数据生成问题,设计了时位-门控循环单元GRU-TP作为生成器结构,对不完整时间序列的时间不规则性进行建模,以充分利用关联信息。设计了由GRUTP网络和全连接网络组成的鉴别器,实现缺失值插补。本文在高铁真实动检数据集上构建了对比实验和消融实验,实验结果验证了该模型的有效性,同时在公共医疗数据集Physio Net上构建的实验也进一步地验证了该方法的泛化性。