基于机器学习和时间序列的黄淮海小麦产量预测方法研究
作者单位:河南农业大学
学位级别:硕士
导师姓名:马新明;李勇
授予年度:2022年
学科分类:12[管理学] 02[经济学] 07[理学] 08[工学] 09[农学] 070103[理学-概率论与数理统计] 0202[经济学-应用经济学] 020208[经济学-统计学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 0901[农学-作物学] 0835[工学-软件工程] 0714[理学-统计学(可授理学、经济学学位)] 0811[工学-控制科学与工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:小麦产量 黄淮海 产量分离 HP滤波 机器学习 时间序列
摘 要:小麦作为主要的口粮作物,其产量约占我国粮食总产量的三分之一。黄淮海地区是我国的重要小麦主产区,小麦生产的稳定发展对国家粮食安全具有重要的意义。科学准确进行小麦产量预测,可为政府部门制定小麦生产计划,指导生产等提供依据。本研究利用黄淮海地区中的河南、山东、河北三省35个气象站点1984-2020年的气象资料作为小麦产量预测的数据,基于HP滤波法将小麦产量分离为趋势产量和气候产量,结合机器学习技术预测小麦的趋势产量,利用时间序列模型预测小麦的气候产量,实现对小麦总产量的预测。主要结果与结论如下:1.基于HP滤波的小麦产量分离。基于农作物产量分离技术,利用HP滤波法对黄淮海三个省35个地区的小麦单产进行产量分离,得到各地区小麦的趋势产量和气候产量,结果表明趋势产量随着时间的推移,增长速度趋于平稳,气候产量的变化规律与小麦实际产量的变化一致。2.基于机器学习的趋势产量预测。基于小麦生育期理论,利用太阳辐射、生育期积温和降水,构建决策树回归(Decision tree regression,DTR)、线性回归(Linear regression,LR)、K近邻回归(K-nearest neighbor regression,KNR)、随机森林回归(Random forest regression,RFR)、Ada Boost回归(ABR)、梯度提升回归(Gradient boost regression,GBR)、Bagging回归(BR)、极端随机树回归(Extreme random tree regression,ETR)八种机器学习模型,实现了小麦趋势产量的预测。结果表明,35个地区的趋势产量预测结果决定系数R均达0.9以上,其中河南省预测精度最优模型为RFR和BR,R均在0.99以上,山东省预测精度最优模型是RFR和ETR,R为0.98~0.99,河北省预测精度最优模型是DTR和GBR,R为0.94~0.97,表明不同区域小麦趋势产量预测优化模型存在一定的差异。3.基于时间序列的气候产量和总产量预测。基于时间序列,通过时间序列数据平稳性检验,参数确定,残差检验,正态分布校验构建了ARIMA(7,1,0)、ARIMA(7,1,1)、ARIMA(8,1,0)三个时间序列模型,实现小麦气候产量的预测。结果表明,各地区气候产量的预测结果R为0.65~0.99,RMSE为120kg/hm~450kg/hm,说明时间序列ARIMA模型对小麦的气候产量预测是可行的;组合趋势产量和气候产量预测结果,实现了黄淮海三省35个地区小麦总产量预测,结果显示,不同地区的最优预测模型组合不同,其中河南省以RFR+ARIMA(7,1,0)的预测组合模型最优,R为0.77~0.97,RMSE为195.41~494.99kg/hm,预测精度均在95.34%以上;山东省以ETR+ARIMA(7,1,0)的预测组合模型最优,R为0.8~0.97,RMSE为162.98~379.78kg/hm,预测精度均在86.89%以上;河北省以DTR+ARIMA(8,1,0)的预测组合模型最好,R为0.86~0.93,RMSE为199.39~291.99kg/hm,预测精度均在95.97%以上。