基于Spark分布式蚁狮算法的小波神经网络短时交通流预测研究
作者单位:湖北工业大学
学位级别:硕士
导师姓名:陈宏伟
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 082303[工学-交通运输规划与管理] 0835[工学-软件工程] 082302[工学-交通信息工程及控制] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 0823[工学-交通运输工程]
摘 要:道路交通高效运作的条件之一就是进行实时准确的车流预测,这不仅能帮助相关交通部门针对外出车辆进行约束和引导,还是智能交通系统(Intelligent Transportation Systems,ITS)众多值得研究的主题之一。近年来,以数据为导向的智能模精度不断提高,很重要的原因之一就是相关道路交通检测数据的获取原来越方便、快捷。其中,深度学习中的神经网络结构被大量应用在道路车流序列估计等各个方面,主要得益于网络模仿人体内大脑单元的学习方式,并具备信息处理和学习的高效能力。然而,合理的计划和方案同样需要应用在如何充分利用复杂海量数据上。除了要管理和存储不同类型的数据之外,全面的数据虽然可以为复杂模型提供丰富的训练数据集,但是这些数据本身也使得项目人员面临着大规模样本处理和复杂特征工程的挑战。因此,海量数据的处理技术与运输行业的融合方案就显现出非比寻常的探讨深度和经济价值。利用海量规模处理技术和Spark分布式多点运算,使得当前如何在合理时间内学习到符合预期要求的数据处理模型成为了本文研究主题,并进而尝试可以打造更复杂的应用程序模型。在对主流多节点异地计算框架Spark的分析研究之后,本文基于分布式内存计算框架Spark提出一种并行改进自适应变异精英加权调整的蚁狮优化算法,其分布式设计采用数据并行和计算并行的混合优化策略,并应用于短期道路车流估测中。具体工作如下所示:首先,对来源于美国加州道路监测评估平台(Peformance Measurement Sys-tem,PeMS)的交通流数据进行识别,完成数据填充和去除隐藏噪音的预处理工作,并利用序列数据暗含混沌这一特点,重建了一维数据的高维复杂构造,以提取更多隐藏的特征。为了加快模型学习的收敛速度,还对训练集进行了归一化。在深入探究了每种常见算法原理的优劣势之后,在小波神经网络(Wavelet Neural NetWork,WNN)的基础上,设计了一个短期道路车流估计模型,并对比分析了模型训练后的实验。实验证明,基于WNN的短期道路车流量估计虽然较为符合实际变化趋势,但在准确性和稳定性方面有待进一步提高。接着,由于随机生成的待优化参数初始值会影响经过梯度计算调整的小波神经网络估计效果。本文介绍了一种新的群体寻优算法Ant Lion Optimizer(ALO),以改进小波神经网络参数设置,为短期道路车流量估计问题设计一个新的算法ALO-WNN,并与传统WNN网络,以及基于GA-WNN和基于PSO-WNN的模型进行了对比实验。结果表明基于ALO-WNN模型的预测精度虽然有了一定的提高,但仍有改进空间。为进一步提高ALO搜索精度,本文提出一种改进自适应变异精英加权调整的蚁狮算法(Improved Weighted Elitism Ant Lion Optimizer,IWALO),经仿真实验分析可得,IWALO-WNN模型在精度高低,整体性能方面,均比上文所涉及的各模型的估测效果更优。最后,典型常见的群体寻优算法仅仅只可以在有限处理器环境下,以顺序模式模拟完成并行迭代,这种运算原则已经无法在合理时间内处理当下时代海量增长的信息集合,为了解决传统算法模型计算量大、模型设计复杂,无法有效利用大规模训练数据的问题。本文将IWALO-WNN算法模型与Spark分布式计算平台结合,提出了数据并行和计算并行融合的分布式设计算法,构成了基于Spark的改进自适应变异精英加权调整的蚁狮算法优化小波神经网络(Spark-IWALO-WNN)的短期道路车流量估测模型。