基于CEEMDAN-PCA-LSTM的上证指数预测
作者单位:兰州大学
学位级别:硕士
导师姓名:陈进源
授予年度:2023年
学科分类:12[管理学] 02[经济学] 0202[经济学-应用经济学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 020204[经济学-金融学(含∶保险学)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:后疫情时代经济复苏,对金融数据预测需求与日俱增,在大数据的背景下,深度学习已经成为金融预测领域的一种重要研究方法.从模型组合和信息分解融合的角度出发,本文提出了一种基于深度学习的中国股票市场的指数预测模型,上海综合指数的成功预测验证了最先进的深度学习算法在非线性时间序列,尤其是金融时间序列预测中的适用性.本文提出的模型在实践中为投资者提供了战略支持,金融市场监督管理和对国家宏观经济调控具有重要意义.本文使用基于主成分分析的带自适应噪声的完全集成经验模式分解算法(CEEMDAN-PCA)对股价序列进行分解和重构,以提取上证综合指数价格序列的关键信息.在此基础上,构建了一个神经网络预测模型CEEMDAN-PCA-LSTM,用于学习指数价格序列的长期依赖性信息.在将不同数据类别的两个序列的特征学习同时映射到同一特征空间后,构造一个共同特征来预测上证综合指数的波动幅度.本文提出的模型可以通过从股价序列中提取关键信息,避免预测模型在训练中的过拟合,提高算法性能和泛化能力,从而有效地提高数据信噪比.在上证指数的预测任务中,CEEMDAN-PCA-LSTM可以充分集成神经网络和信息分解融合的优势,弥补单个模型的局限性.与所选择的基准模型相比,本文构建的综合预测模型在预测上证综合指数综波动范围方面具有显著优势,在分类准确率等各项指标上最大提高了13%.本文的创新点包括:(1)结合了CEEMDAN-PCA算法,将信号分解与降维技术运用到股票预测任务中,挖掘金融时间序列的多尺度信息并降低噪声.(2)在此基础上构建了CEEMDAN-PCA-LSTM模型,并针对金融时序预测任务对序列进行优化,充分结合了LSTM在空间和时间维度上的特征提取能力.