不同机器学习模型在流域输沙模拟中的应用与解释
作者机构:西安理工大学西北旱区生态水利工程国家重点实验室 旱区生态水文与灾害防治国家林业局重点实验室 国家林业和草原局西北调查规划院
出 版 物:《应用基础与工程科学学报》 (Journal of Basic Science and Engineering)
年 卷 期:2024年
核心收录:
学科分类:08[工学] 081502[工学-水力学及河流动力学] 0815[工学-水利工程]
基 金:国家自然科学基金黄河水科学研究联合基金重点项目“黄河中游水系格局与河流形态变化及水沙效应”(U2243201) 陕西省2023年重点研发计划:陕西典型地貌单元植被-土壤-水体固碳能力评估与监测关键技术研究(2023-ZDLSF-65)
主 题:水文过程 输沙量 机器学习 SHAP解释 窟野河流域
摘 要:输沙量的测量既费力又费时,因此需要其他技术从更容易测量的变量中提供输沙量信息。本研究旨在利用机器学习模型准确预测窟野河流域的输沙量,并揭示主导输沙过程的关键水文、气象和人类活动因子。研究采用随机森林模型(RF)、支持向量机模型(SVM)、轻量级梯度提升机(LGBM)、极端梯度提升(XGBoost)、Lasso回归和K近邻算法(KNN)六种机器学习模型预测窟野河流域输沙量。进一步基于合作博弈论中沙普利加性解释(SHAP,Shapley Additive exPlanations)的方法,来确定不同影响因素对输沙量预测的重要性和解释性。结果表明,六种机器学习模型在输沙量预测方面表现良好,其中RF模型表现出最低的预测误差和最高的效率(RMSE=0.51,R2=0.95,MAE=0.38,NSE=0.94)。SHAP分析强调了径流量作为最关键的水文因子,以及坝地、草地、林地和采矿面积等人类活动因子在抑制输沙过程中的显著性,而气象因子的影响相对较小。此外,分析还揭示了不同因子对输沙量的作用趋势,反映了模型的高解释能力。研究结果显示,机器学习模型在预测河流输沙量方面展现了较高的准确性,尤其在解释复杂的输沙过程方面展现出潜在的优势,为未来的水沙模拟、土壤退化分析及水土保持措施的设计提供了宝贵的科学支持。