基于EMD和CatBoost算法的改进时间序列模型——以大连市PM_(2.5)预测为例
Improved time series models based on EMD and CatBoost algorithms:taking PM_(2.5) prediction of Dalian City as an example作者机构:大连海洋大学海洋与土木工程学院辽宁大连116023 复旦大学大气与海洋科学系上海200438 重庆大学土木工程学院重庆400044 大连海洋大学信息工程学院辽宁大连116023
出 版 物:《南京林业大学学报(自然科学版)》 (Journal of Nanjing Forestry University:Natural Sciences Edition)
年 卷 期:2024年第48卷第3期
页 面:268-274页
核心收录:
学科分类:07[理学] 070602[理学-大气物理学与大气环境] 0706[理学-大气科学]
基 金:辽宁省博士科研启动基金项目(2020-BS-216) 国家级大学生创新创业训练计划(202110158002) 辽宁省大学生创新创业训练计划(S202210158006)
主 题:PM_(2.5)浓度 经验模态分解(EMD) 时间序列模型 混合模型 CatBoost算法 机器学习 大连市
摘 要:【目的】解决传统大气PM_(2.5)浓度时序预测时精度较低问题,减少PM_(2.5)时间序列的非线性、高噪声、不平稳与波动性对预测的影响,从而更精确地预测PM_(2.5)浓度。【方法】以2014年1月1日至2022年1月31日大连市雾霾天气时PM_(2.5)数据为例,提出了经验模态分解(EMD)、分类提升(CatBoost)、自回归综合移动平均模型(ARIMA)组合的混合机器学习时间序列模型,并与传统自回归模型(AR)、ARIMA,以及只加入EMD方法后的混合模型进行比较。【结果】混合模型EMD-CatBoost-ARIMA较原始序列均方根误差(RMSE)改进20.76%,平均绝对值误差(MAE)改进17.40%,希尔不等系数(TIC)改进29.17%。【结论】对于高熵值的重构序列,EMD分解方法和CatBoost算法能够显著提升PM_(2.5)时间序列模型的预测性能。相比较传统时间序列模型,EMD-CatBoost-ARIMA模型对大气PM2.5浓度预测性能较高。