大数据背景下的多来源数据融合研究
作者机构:石家庄市统计局河北石家庄050011 吉贝克信息技术(北京)有限公司北京100355
出 版 物:《统计与管理》 (Statistics and Management)
年 卷 期:2019年第34卷第5期
页 面:18-25页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:2017-2018年度河北省统计科学研究计划重点项目“大数据背景下的多来源数据融合研究”(2017HZ12)
摘 要:石家庄统计大数据平台融合了不同行业、不同系统、不同结构的不同数据,通过数据仓库和大数据Hadoop构建理论,实现了调查信息采集、多主题与多维度数据挖掘、跨部门数据关联对比分析、经济运行监测预测和风险预警.本项目依据石家庄统计大数据平台建设的经验,对系统建设过程中涉及到的数值数据、文本数据、图片数据等多来源数据,阐述大数据环境下数据融合的机制、交换标准、数据规则、管理模式和实现手段,为统计大数据运行机制的建立提供参考.