基于定位数据的人口分布特征研究
作者单位:中国地质大学(北京)
学位级别:硕士
导师姓名:郑新奇
授予年度:2015年
学科分类:02[经济学] 081603[工学-地图制图学与地理信息工程] 081802[工学-地球探测与信息技术] 0201[经济学-理论经济学] 020106[经济学-人口、资源与环境经济学] 07[理学] 08[工学] 070503[理学-地图学与地理信息系统] 0818[工学-地质资源与地质工程] 0705[理学-地理学] 0816[工学-测绘科学与技术]
摘 要:智能手机、全球定位系统与移动互联网的发展共同促进了一项新型的服务——基于位置的服务。不同于传统的互联网服务,基于位置服务立足于智能手机的定位功能,提供与用户地理位置高度相关的信息服务。智能手机普及率持续升高,移动互联应用形式多样化,移动定位技术起到了基础的作用。移动定位技术不仅为用户的生活提供了便利,为移动应用提供了基础服务,并且其服务过程中产生的大量用户实时定位数据。大规模用户的位置信息,可以作为对城市运行状态的一种检测手段。由于智能手机的普及,大规模的定位数据是对人口空间分布的一种采样。利用Hadoop平台的大数据处理分析能力,对百度移动定位服务系统运行日志进行整合,获取定位密度影像数据。基于对定位数据的分析,结合与夜间灯光数据、微博签到数据的对比,揭示了人口的空间分布特征,并有以下的结论:1.用户定位数量在时间上呈现周期性的变化;2.人口的分布在空间上呈现幂律分布特征;3.定位数据能够很好的刻画人口的空间分布及其时间变化。基于人口空间分布特征,定位密度可以理解为人口分布的一种抽样调查,尝试以定位数据进行了人口密度制图。对定位密度数据的时空变化进行了分析,验证了定位密度数据包含有大量地理空间相关信息,以此为依据,进行两个方面的应用研究:1.人类的各种活动与城市空间密不可分,基于随机森林算法,训练了城市建成区的分类模型,进行了全国城市建成区制图。2.定位密度的时空变化与城市用地类型有很强的相关性,采用梯度迭代决策树算法,训练了城市用地类型分类模型,并验证模型的有效性。通过对人口时空分布特征的研究,以及对人口时空分布变化中隐藏的大量信息的挖掘,本文实践了以人为传感器的思想,验证了用户生成位置数据在地理研究中的巨大潜力。