咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种新的基于强化学习改进SAR的无人机路径规划 收藏

一种新的基于强化学习改进SAR的无人机路径规划

A novel modified search and rescue optimization algorithm based on reinforcement learning for UAV path planning

作     者:周文娟 张超群 汤卫东 易云恒 刘文武 秦唯栋 ZHOU Wen-juan;ZHANG Chao-qun;TANG Wei-dong;YI Yun-heng;LIU Wen-wu;QIN Wei-dong

作者机构:广西民族大学人工智能学院南宁530006 广西混杂计算与集成电路设计分析重点实验室南宁530006 

出 版 物:《控制与决策》 (Control and Decision)

年 卷 期:2024年第39卷第4期

页      面:1203-1211页

核心收录:

学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(62062011) 广西民族大学研究生创新计划项目(gxun-chxs2021057) 

主  题:强化学习 搜索与救援优化算法 异步优势演员-评论家算法 路径规划 路径调整 无人机 

摘      要:搜索和救援优化算法(SAR)是2020年提出的模拟搜救行为的一种元启发式优化算法,用来解决工程中的约束优化问题.但是,SAR存在收敛慢、个体不能自适应选择操作等问题,鉴于此,提出一种新的基于强化学习改进的SAR算法(即RLSAR).该算法重新设计SAR的局部搜索和全局搜索操作,并增加路径调整操作,采用异步优势演员评论家算法(A3C)训练强化学习模型使得SAR个体获得自适应选择算子的能力.所有智能体在威胁区数量、位置和大小均随机生成的动态环境中训练,进而从每个动作的贡献、不同威胁区下规划出的路径长度和每个个体的执行操作序列3个方面对训练好的模型进行探索性实验.实验结果表明,RLSAR比标准SAR、差分进化算法、松鼠搜索算法具有更高的收敛速度,能够在随机生成的三维动态环境中成功地为无人机规划出更加经济且安全有效的可行路径,表明所提出算法可作为一种有效的无人机路径规划方法.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分