云计算中依赖任务动态并行调度机制的研究
作者单位:大连理工大学
学位级别:硕士
导师姓名:王占杰
授予年度:2011年
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:现在云计算已经成为工业界和学术界研究的热点,并逐渐发展成为最有应用前景的商业计算模式之一。云计算依托于成熟的虚拟化技术,在分布式计算、网格计算的基础上发展而来,其目的是为用户提供可靠的、个性化的、有QoS保障的服务。而云环境中提供的服务多种多样,怎样根据用户的需求对服务进行调度执行,并保证服务质量是需要解决的重点问题之一 云计算中大多数应用服务要分解成若干子任务后进行调度,分解后的子任务之间又具有不同程度的依赖关系。如何提高强耦合依赖任务调度的并行性、实时性和动态性,提高系统利用率,对有依赖关系的任务请求进行合理的调度与部署,成为当前分布式计算和云计算要解决的热点。而目前对于依赖任务调度问题,现有的各种算法通常基于不.同的模型假设。这些早期的调度模型中很多假设并不符合云环境的特点。并且大多数调度算法是基于古典的列表调度思想,难以根据系统资源的实时信息进行动态调度;忽略了依赖任务调度的并行性,使得系统资源不能得到充分利用,降低了系统利用率 为了更好地解决云计算中的依赖任务调度问题,本文提出了一个适合云环境的依赖任务系统模型,允许计算节点的动态加入和退出,提高了系统的自组织性和可扩展性,更适合现实应用。然后基于这个模型构建了一个依赖任务动态并行调度机制TDDPS。首先介绍了调度机制的整体模型,其中包括依赖任务调度的问题描述和资源匹配,并且为了提高调度过程中资源匹配的速度,提出了基于多模式自动机的匹配方法;然后对动态并行调度机制进行了详细描述。该机制通过DAG入度为零的条件解耦合来动态地构建就绪任务集合,描述某个时刻可并行的任务;然后根据系统实时资源信息并行地进行分布式多目标协商调度,有效地提高了调度并行性;在任务分配时还考虑任务执行和任务间通信开销(E/C),来决定是否用任务复制来代替部分数据传输,以减少通信开销。该调度机制可动态对多个任务进行并行分布式多目标协商调度,能较好的兼顾实时性、通信开销和负载均衡等性能指标,通过动态调度策略来提高系统的整体性能。