基于随机森林的深圳二手房价格分析
作者机构:韩山师范学院经济与管理学院金融大数据中心广东潮州521000 韩山师范学院数学与统计学院广东潮州521000
出 版 物:《中国市场》 (China Market)
年 卷 期:2022年第26期
页 面:68-71,133页
学科分类:12[管理学] 1204[管理学-公共管理] 07[理学] 070104[理学-应用数学] 120405[管理学-土地资源管理] 0701[理学-数学]
基 金:广东省普通高校青年创新人才类项目(项目编号:2020WQNCX052) 韩山师范学院博士启动项目(项目编号:QS202006)
摘 要:文章通过网络爬虫技术从链家网站上爬取与深圳二手房在售房源相关的15个特征变量的数据集,构建基于随机森林算法的预测模型。为提高模型预测精度,首先借助于交叉验证和网格搜索技术对随机森林模型的相关参数进行寻优,并在此基础上对房价进行预测。结果表明,该模型在训练集上的R~2为97.5%,在测试集上的R~2为87.5%,预测性能较好。进一步通过分析各特征变量对房价的影响程度发现,建筑面积、房屋户型和所在区域对房价的影响较大,而其余特征变量对房价的影响相对较小,该结论的得出可为后续研究奠定基础。