基于梯度提升算法和SHAP的石家庄PM_(2.5)和臭氧浓度预测及影响因素分析
Prediction of PM_(2.5)and ozone concentration in Shijiazhuang and analysis of influencing factors based on gradient boosting algorithm and SHAP作者机构:延安大学数学与计算机科学学院延安716000
出 版 物:《环境科学学报》 (Acta Scientiae Circumstantiae)
年 卷 期:2024年第44卷第7期
页 面:402-409页
核心收录:
学科分类:07[理学] 070602[理学-大气物理学与大气环境] 0706[理学-大气科学]
基 金:延安市科技局项目(No.203010096) 延安大学校级项目(No.205040306)
摘 要:PM_(2.5)和O_(3)是两种常见的空气污染物,目前针对空气污染的预报解析方法有很多,但大多存在分类器训练不足、过拟合、可解释性较差等问题.为了解决这些问题,本文使用梯度提升算法和SHAP对PM_(2.5)和O3浓度进行预测分析,利用2015-01-01—2021-12-31石家庄市的大气污染物数据和气象数据,分析了不同梯度提升树算法(LightGBM、GBR、XGBoost)的预测精度.实验结果表明,XGBoost对PM_(2.5)的预测精度高于LightGBM和GBR模型,LightGBM对O3的预测精度在评价指标上均优于GBR和XGBoost模型.最后通过模型解释方法SHAP,分别识别出影响PM_(2.5)和O3浓度的关键因素.研究表明PM10、CO和SO2对PM_(2.5)的浓度影响显著,NO_(2)、TEMP对O_(3)浓度贡献较大.