咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于Storm平台的ETL方案实现 收藏

一种基于Storm平台的ETL方案实现

Implementation of ETL Scheme Based on Storm Platform

作     者:梁奎奎 LIANG Kui-kui

作者机构:浙江工业大学计算机科学与技术学院 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2019年第46卷第S11期

页      面:208-211,240页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:ETL 垂直切分 水平切分 Storm 负载优化 

摘      要:随着互联网在各个领域的不断发展,数据开始呈现结构多样化与体积海量化。面对海量数据的冲击,如何提高ETL的效率至关重要。针对“信息孤岛中数据来源及格式皆不统一、数据采集实时性差的问题,提出垂直切分ETL工作流和水平切分待处理数据集,建立一种基于Storm平台的流式ETL处理方案。同时,针对Storm在进行任务分配时对工作节点CPU负载不敏感的缺点,通过定时任务记录工作节点的CPU负载信息,对Storm调度器的slot分配方式进行优化,使得Storm集群的负载更加均衡。实验结果证明该方案可有效提高ETL的处理效率,同时针对slot分配优化可有效地提高系统稳定性与处理效率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分