基于KNN融合XGBoost的通勤期间路段出行时间预测研究
作者单位:南京大学
学位级别:硕士
导师姓名:徐红利
授予年度:2020年
学科分类:08[工学] 082303[工学-交通运输规划与管理] 082302[工学-交通信息工程及控制] 0823[工学-交通运输工程]
主 题:出行时间预测 KNN XGBoost T-car车辆占比
摘 要:随着数据采集技术的进步和数据分析方法的发展,利用历史交通数据对未来(短期)的交通变量(速度,平均出行时间,车道占有率)进行预测成为交通管制措施实施的重要依据。对于高峰期路段出行时间的预测,可以帮助路段的出行者合理的规划行驶路径,也可以协助道路的监管者识别拥挤路段,提前采取相应的疏导措施,以避免交通拥堵的发生。通勤期间(早高峰)的路段出行时间预测是本文关注的焦点。本文首先对于交通预测领域的文章进行了梳理,总结了该领域常用的交通特征和模型方法,紧接着文章对于高峰期的类通勤车辆进行识别,将该类车辆定义为T-car车辆,文章探究了该类车辆在路段当天全部出行车辆的占比与当天路段高峰期平均出行时间的相关性,并将这类车辆的占比纳入到预测模型中,提升了预测结果的精确度。随后,文章在XGBoost模型的基础上,参考了KNN模型融合的思想,构建了基于KNN融合的XGBoost通勤期间路段出行时间预测模型。本文搜集了某地级市2013年7月至11月之间的车牌识别数据进行实证研究,验证了该模型相比于传统的KNN模型,SVM模型和GBDT模型具有更高的预测精确度,并且随着预测提前期的增加,该模型的预测精度具有更高的稳定性。本文的核心工作主要分为以下三个部分:第一部分,预测模型的构建关注到交通数据的时空特征,不仅关注待预测路段上出行时间的相关性,还考虑了相邻路段的出行时间变化对于该路段出行时间的影响。第二点,文章提出了T-Car车辆的识别方法,并将该类车辆的占比纳入到模型预测中。第三点,利用KNN的融合思想,提高了XGBoost出行时间预测模型的预测精度。该模型的提出期望能够充分利用车牌识别数据的特性,关注车辆的轨迹信息,以提高路段高峰期出行时间预测的准确度。