特征融合和集成学习在房价预测中的应用研究
作者单位:重庆邮电大学
学位级别:硕士
导师姓名:刘歆
授予年度:2022年
学科分类:12[管理学] 1204[管理学-公共管理] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 120405[管理学-土地资源管理] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:在房价预测技术研究和应用中,由于房价交易数据获取的不确定性,导致在构建等间隔时序序列时会出现数据缺失问题,而现有的研究并未过多考虑这些缺失问题所带来的影响。同时,现有的研究通过集成学习的方式让预测模型可以提取更多的特征,但都未过多考虑政策和经济因素所带来的影响以及多个模型的训练问题。因此,针对构建时序序列时所出现的数据缺失问题、政策和经济因素的影响以及多个模型的训练问题,本论文提出的解决方案如下:1.提出了一种基于时间衰减函数的房价长短期记忆预测模型(简称AD_LSTM),以降低时序序列中因数据缺失对模型训练产生的影响。该模型在LSTM的忘记门之前加入子空间分解和时间衰减函数:子空间分解可以将记忆矩阵分解成最优子空间,修正缺失项所带来的错误记忆;时间衰减函数可以根据当前记录和上一个记录之间出现的缺失项来对记忆矩阵进行衰减。在时间衰减运算过程中,以缺失项的数目作为权重来对记忆矩阵进行更改,以此感知缺失项的存在。把改进的AD_LSTM模型用于在北京市房价数据集进行实验验证,实验结果相较于已选择的基准模型,AD_LSTM能更好地降低缺失项所带来的影响,具有更低的预测误差。2.提出了一种基于注意力机制的房价预测集成模型,用于将房价数据集中的时序特征和多维特征进行融合以进行房价预测。在进行房价预测时不仅要考虑房价随时间变化的因素,还要考虑多维特征的影响。集成模型的构建过程为:首先对影响房价的多维特征进行分析和选择,构建基于多维特征的BP神经网络房价预测模型。然后引入协同注意力机制将基于多维特征的BP神经网络房价预测模型和AD_LSTM模型进行集成训练,得到最终的集成模型。通过设置对比实验进行验证,构建的集成模型具有更低的预测误差。最终根据集成预测模型设计与实现一个房价预测系统,该系统可根据用户输入的房屋信息得到未来6个月的房价预测结果,并对预测结果进行可视化。