基于可解释机器学习模型的南宁市野火灾害易发性研究
Wildfire Hazard Susceptibility in Nanning Based on Interpretable Machine Learning Model作者机构:桂林理工大学测绘地理信息学院桂林541006 广西空间信息与测绘重点实验室桂林541006
出 版 物:《科学技术与工程》 (Science Technology and Engineering)
年 卷 期:2024年第24卷第2期
页 面:858-870页
学科分类:083002[工学-环境工程] 0830[工学-环境科学与工程(可授工学、理学、农学学位)] 08[工学] 0838[工学-公安技术]
基 金:国家自然科学基金(42064003) 广西自然科学基金(2021GXNSFBA220046)
主 题:野火灾害 野火易发性评价 机器学习模型 SHAP 模型解释
摘 要:野火易发性评价对野火灾害的前期预防以及灾害管理决策的制定至关重要。目前野火易发性的研究主要集中于提高模型的预测精度,而往往忽略对模型的内部决策机制进行解释分析。为此,构建了一种基于可解释机器学习的野火易发性模型,并详细分析了各因子对野火易发性预测结果的影响。以南宁市历史野火样本为基础,综合考虑样本的空间分布特征,选取高程、归一化植被指数(normalized difference vegetation index, NDVI)、年均降雨和平均气温等18项评价因子,利用分类和回归树(calssification and regression tree, CART)、随机森林(random forest, RF)、轻量的梯度提升机(light gradient boosting machine, LGBM)和极致梯度提升(extreme gradient boosting, XGBoost)4种机器学习模型构建野火易发性预测模型。基于性能最优的易发性模型,运用沙普利加和解释(shapley additive explanations, SHAP)方法完成特征全局性解释、依赖性分析和典型样本的局部性分析。结果表明:XGBoost较其他模型拥有更优的预测性能,其极高易发区位于南宁市西北部、东部及南部,占全域面积的39.113%;野火灾害易发性主要受NDVI、年均降雨、土壤类型等9项因子的影响;对典型历史野火样本的局部性解释结果可为南宁市指定区域的野火灾害的治理提供针对性参考和指导。