咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于GPU的群智能算法研究与实现 收藏
基于GPU的群智能算法研究与实现

基于GPU的群智能算法研究与实现

作     者:韩文成 

作者单位:西安理工大学 

学位级别:硕士

导师姓名:马炫;熊刚

授予年度:2019年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:粒子群优化算法 CUDA streams 动态并行 局部搜索 

摘      要:随着GPU等高性能平台近些年来的不断发展,同时群智能算法所具有的隐含并行性为算法在GPU上的实施提供了有利的平台基础,基于GPU平台的群智能算法逐渐成为解决高维复杂优化问题的首选。本文以群智能算法中具有代表性的粒子群优化算法(PSO,Particle Swarm Optimization)为例,研究如何进一步利用 GPU上的CUDA(Compute Unified Device Architecture)平台的计算性能,充分发挥群智能算法并行性的优势。主要研究工作如下:为充分利用GPU的计算资源,同时为提高算法的收敛精度,提出了基于CUDA streams的多种群PSO算法,使用基于岛屿模型的并行多种群机制,结合CUDA平台的流并发机制,将stream的数量与子群的数量一一对应,提高了原始算法的并行程度,使得并行PSO算法在原始线程级并行的基础上实现了更高级别的网格级并行,充分利用了 GPU的计算资源。实验结果表明,在使用4或8个stream时,提出的算法相对于单种群模式缩短了约30%的运行时间。讨论了CPU端与GPU端的伪随机数对群智能算法的收敛性影响,结果表明使用GPU端的伪随机数进行初始化使得算法收敛到门限值的概率提高了 10%左右;由于算法的初始化实施了并行,提高了群智能算法的并行化程度。最后为解决PSO算法易陷入局部最优的问题,提出了基于CUDA动态并行机制的多起点局部搜索算法框架。由于动态并行机制的引入,当多个初始解并行地进行局部搜索时,每个解的邻居解也将进行并行搜索,使得算法的并行层次更高,整体性更强。将该框架整合至基于CUDA streams的多种群PSO算法,使得算法在获得加速的同时,相较于改进前的算法平均最优解获得了至少两个数量级的提升,增强了算法的寻优能力,提高了算法的鲁棒性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分