基于机器学习的交通碳排放预测模型构建与分析
Construction and Analysis of Machine Learning Based Transportation Carbon EmissionPrediction Model作者机构:长安大学运输工程学院西安710064
出 版 物:《环境科学》 (Environmental Science)
年 卷 期:2024年第45卷第6期
页 面:3421-3432页
核心收录:
学科分类:12[管理学] 1204[管理学-公共管理] 1202[管理学-工商管理] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0828[工学-农业工程] 0817[工学-化学工程与技术] 0901[农学-作物学] 0835[工学-软件工程] 0703[理学-化学] 0714[理学-统计学(可授理学、经济学学位)] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 0823[工学-交通运输工程]
摘 要:针对交通运输碳排放问题,基于2005~2019年30个省份的面板数据,采用多种机器学习算法构建不同预测模型对30个省份的交通碳排放量与影响因素进行分析.首先,基于固定效应模型思想将省份差异转化为影响因素,进一步采用Pearson相关系数法与Spearman秩相关系数相结合的方法对18个交通碳排放影响因素进行筛选;其次,采用K-折交叉验证方法,并绘制学习曲线对各预测模型性能进行测试,选用MSE、MAE、R2和MAPE作为模型的评价指标进行分析,来选定最佳预测模型,并选择SHAP值来计算最佳预测模型中各解释变量的重要度.结果表明,省份差异、社会商品消费总额、城市绿地面积、货运周转量、私家车数量、交通运输业产值和常住人口这7个因素之间多重共线性弱且均通过显著性检验,可作为交通运输碳排放预测模型的解释变量;随机森林算法和XGBoost算法预测结果均表现优异,R2均高于0.97,误差均低于10%,且不存在过拟合与欠拟合现象,其中XGBoost算法表现最优,而KNN算法表现欠佳;各解释变量的重要度排名为:省份差异社会商品消费总额私家车数量常住人口货运周转量城市绿地面积交通运输业产值,综合相关性与重要性分析来看,在交通运输碳排放预测中,省份差异是一个不可忽视的变量.研究结果可为政策制定者和决策者提供参考,促进交通运输行业的可持续发展.