咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Stacking算法的快递业务量预测研究 收藏
基于Stacking算法的快递业务量预测研究

基于Stacking算法的快递业务量预测研究

作     者:李梅芳 

作者单位:景德镇陶瓷大学 

学位级别:硕士

导师姓名:周永正

授予年度:2022年

学科分类:02[经济学] 0202[经济学-应用经济学] 020205[经济学-产业经济学] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 

主      题:快递业务量 Stacking算法 麻雀搜索算法 SHAP模型 

摘      要:快递业是服务业的重要组成部分,而预测快递业务量是快递业研究领域的一个重要课题。因此,本文在Python 3.7编程语言环境下对2008年1月至2021年5月我国的月度快递业务量相关数据进行预测分析。主要研究工作如下:1.采用Spearman等级相关系数和距离相关系数的方法分析各影响因素与快递业务量的相关关系,最终构建了快递业务量预测的指标体系,包含社会消费品零售总额、互联网宽带用户数、民航货运量、汽油产量、发电量以及邮政业务量6个指标。2.对快递业务量序列做单一时间序列分析,实验结果:SARIMA(0,1,1)(0,1,0) 模型、Holt-Winters季节加法与乘法模型的预测平均绝对百分比误差(MAPE)分别为8.646%、36.6%和38.8%,且SARIMA(0,1,1)(0,1,0) 模型在其他三种误差中的占比都最小,预测精度最高为0.88。3.对快递业务量相关数据做基于Stacking算法的预测分析。利用贝叶斯优化、麻雀搜索算法以及Circle映射改进的麻雀搜索算法优化七个机器学习回归算法的超参数,通过交叉验证的方法最终得出基回归器为GBDT算法、RFR算法、SVR算法和元回归器是Ridge回归算法的基于Stacking算法的模型的预测效果最好,预测精度为0.945,MAPE为8.587%,对比SARIMA(0,1,1)(0,1,0) 模型分析得:前者的预测精度比后者提高了6.5%、MAPE降低了0.059%,表明引入的基于Stacking算法的预测模型对我国月度快递业务量数据进行预测分析具有很好的适用性。通过SHAP模型量化分析特征变量得出:互联网宽带接入用户数(信息化因素)是快递业务量的关键影响因素。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分