集成学习和动态融合算法在福建省短时强降水预报中的应用
Application of Ensemble Learning and Dynamic Fusion for Short-Time Severe Rainfall Forecasting in Fujian Province作者机构:厦门市海峡气象开放重点实验室厦门361012 福建省灾害天气重点实验室福州350001 福建省漳州市气象局漳州363005 集美区气象局厦门361021
出 版 物:《气象》 (Meteorological Monthly)
年 卷 期:2024年第50卷第1期
页 面:48-58页
核心收录:
学科分类:07[理学] 070601[理学-气象学] 0706[理学-大气科学]
基 金:厦门市气象局科技专项(3502Z20214ZD4014) 中国气象局复盘总结专项(FPZJ2023-065) 中国气象局/广东省区域数值天气预报重点实验室开放基金课题(J202005)共同资助
主 题:LightGBM 短时强降水预报 样本不平衡 动态融合
摘 要:为了提高短时强降水预报准确性,在2019—2020年4—9月福建省逐时降水实况观测资料与中国气象局广东快速更新同化数值预报系统(CMA-GD)模式预报产品的基础上,应用LightGBM集成学习算法框架,建立以30 mm·h^(-1)为阈值的逐时降水预报模型。通过特征处理、自助聚合及超参数搜索等技术对模型进行优化,结合AUC、AUPR与传统分类指标,设计了包括业务模拟测试在内的多项试验,通过对比各建模方案验证了模型对于较长时效的短时强降水预报的适用性。结果表明:模式预报本身的命中率和空报率均较高,各建模方案具有不同程度的改善作用。自助聚合可以增强模型预测稳定性,轻微不平衡子训练集能降低模型预测空报率而取得更高的综合评分,在验证集中最佳TS评分可达17.5%;对分类信息增益贡献最大的特征变量为K指数,其次为500 hPa露点温度和时间参数特征;试验指标从优到劣依次为:随机交叉验证、小时划分的随机交叉验证、业务模拟测试,可见模型有效性主要来自相同或相邻时刻的样本信息;设计基于逻辑回归的异质模型动态融合方案以改善静态同质模型表现,各项指标均有小幅提升,在命中率接近50%时削减空报样本超过52万个。