咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >RGraph:基于RDMA的高效分布式图数据处理系统 收藏

RGraph:基于RDMA的高效分布式图数据处理系统

RGraph:Effective Distributed Graph Data Processing System Based on RDMA

作     者:崔鹏杰 袁野 李岑浩 张灿 王国仁 CUI Peng-Jie;YUAN Ye;LI Cen-Hao;ZHANG Can;WANG Guo-Ren

作者机构:东北大学计算机科学与工程学院辽宁沈阳110819 北京理工大学计算机学院北京100081 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2022年第33卷第3期

页      面:1018-1042页

核心收录:

学科分类:0907[农学-林学] 08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论] 0713[理学-生态学] 

基  金:CCF-华为数据库创新研究计划(DBIR2019007B)。 

主  题:分布式 图处理系统 高性能 RDMA 动态负载均衡 RDMA通信模型 

摘      要:图是描述实体间关系的重要数据结构,被广泛地应用于信息科学、物理学、生物学、环境生态学等重要的科学领域.现如今,随着图数据规模的不断增大,利用分布式系统来处理大图数据已经成为主流,出现了形如Pregel、GraphX、Power Graph和Gemini等经典的分布式大图数据处理系统.然而,与当前先进的基于单机的图处理系统相比,这些经典的分布式图处理系统在处理真实的图数据时并没有充足或稳定的性能优势.分析了几个有代表性的分布式图处理系统,总结并归纳出了影响其性能的主要挑战.通过对这些挑战的深入研究,提出了RGraph——一个基于RDMA的高效分布式大图数据处理系统.RGraph旨在通过充分利用RDMA的优势来提升图处理系统多个方面的性能.在图划分方面,RGraph采用基于块的划分方式避免破坏原始图数据的局部性,从而保证顶点的高效访问.在负载方面,RGraph提出了基于RDMA单边READ的任务迁移机制和线程间细粒度的任务抢夺方式来分别保证计算节点间以及计算节点内线程间的动态负载均衡,确保集群中的所有计算资源能够被充分利用.在通信方面,RGraph通过对IB verbs的有效封装,实现了符合图计算语义的多线程RDMA通信模型.相比于传统的MPI,RGraph的通信机制可以减少计算节点间2.1倍以上的通信延迟.最后,利用5个真实大图数据集和1个合成数据集,在拥有8个计算节点的高性能集群上测试了RGraph.实验结果表明,RGraph具有明显的性能优势.相比于Powergraph,RGraph具有10.1-16.8倍的加速比,与当前最先进的分布式图处理系统相比,RGraph的加速比仍能达到2.89-5.12倍.同时,RGraph在极度偏斜的幂律图上也能保证稳定的性能优势.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分