DCFT-Kernel:一种基于组服务的机群容错管理系统的设计与实现
DCFT-Kernel: A Fault-Tolerant Cluster Middleware Based on Group Service作者机构:中国科学院计算技术研究所
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2005年第42卷第6期
页 面:993-999页
核心收录:
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"八六三"高技术研究发展计划重大专项基金项目(2002AA104410) 国家"八六三"高技术研究发展计划软件重大专项基金项目(2002AA1Z2102)
摘 要:高可用和容错已经成为衡量机群系统(简称机群)的一个重要指标,随着机群的规模越来越庞大,如何实现大规模机群下的容错管理软件成为了技术难点.以传统分布式系统中的组通信技术为基础,采用将复杂的系统“分而治之的思想,提出了组服务技术,可以解决容错管理软件的可扩展性和高可用性.同时,在组服务技术的基础上,结合实时的事件服务技术实现了一个大规模机群下的容错管理系统DCFTKernel,介绍了实现组服务和DCFTKernel的主要技术问题,并且对DCFTKernel的性能进行了分析.