咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向防御任务的复杂海洋环境下无人艇导航避障策略研究 收藏
面向防御任务的复杂海洋环境下无人艇导航避障策略研究

面向防御任务的复杂海洋环境下无人艇导航避障策略研究

作     者:刘远 

作者单位:上海大学 

学位级别:硕士

导师姓名:武星

授予年度:2019年

学科分类:08[工学] 082402[工学-轮机工程] 0824[工学-船舶与海洋工程] 

主      题:防御策略 无人艇 导航避障 群智仿生 强化学习 

摘      要:如今时代随着战争要求不断提升,在科技日益发展的今天,无人化的武器系统成为研究热点,着重增强无人体系的自动化水平和智能化程度,不断发掘其在民用和军事领域的应用潜力。水面无人艇、空中无人机、地面无人车及水中无人潜艇等不同形式的智能体可在大范围时空领域内进行实时环境监测,感知敌情的变化,并迅速做出相对的应急反应。水面舰艇的无人化已经成为海上军队装备建设的发展趋势,其灵活性和智能性等特点使其得以广泛应用,尤其是作用于危险区域或人为不易达海洋领域,在一定程度了最大话地扩展了其操作范围和能力。因此,在面向防御任务的复杂海洋环境下多无人艇的导航避障策略研究中,其智能性能和自主能力是重中之重。本文主要针对无人艇的自主导航避障和智能任务分配能力进行分析,研究基于仿生型群智思想和深度强化学习的无人艇防御策略,这是迈向人工智能的重要途径,因此本文的研究工作分为以下几个方面:第一,复杂海洋环境下多无人艇防御场景的构建。设置场景环境状态是解决无人艇防御问题的基础,因此本文对无人艇防御的策略实现进行问题建模,并构建相应的多无人艇防御场景。对多无人艇而言,保持相应编队形状并分布在保卫目标的周边,以此保证对监测区域的最大覆盖和实时感知。其中无人艇分为主控艇和分艇两大类,通常情况下无人艇沿着巡逻线进行区域的巡逻监控,当感知到可疑敌船的入侵时,主控艇便收集从各分艇发来的实时监测信息,进行信息融合和智能决策,并向相应分艇发布防御指令,从而各分艇按照所接收的指令执行任务,并向主控艇实时反馈信息等等。多无人艇个体间的协同与合作可抵抗外界多方向的入侵,而有效应用战术可增强自身安全性。同时针对主控艇对整体防御体系的唯一及高效控制问题,本文提出协调控制技术,基于主从式思想,解决当主控艇出现问题时,可使用其它备用艇进行替换,防止防御体系陷入混乱,保证其持续性的有效运作。第二,基于群智思想的多无人艇防御策略。多个无人艇间的协同操作来共同完成一项任务可体现群体作业的优势,不仅使得独立个体的表现性能得以提升,而且还能成功完成个体无能为力的任务。在本文中,受自然界中群体行为的启发,例如蚂蚁觅食、蜜蜂筑巢、大雁南飞等活动,可以想到当多个无人艇协同作业共同抵抗外部入侵力量时,可呈现强大的凝聚力。因此提出群智思想的多无人艇防御策略,基于多无人机对空中多个侦查站点的覆盖巡逻GI-DORA(dynamic overlay reconnaissance algorithm based on genetic idea),实时获取海面地图信息,然后制定用于多无人艇拦截多方向入侵敌船的防御任务分配方案,包含基于变异和交叉思想的离散粒子群方法,以进行初始全分配或重分配方式MC-DPSO(dispersed particle swarm optimization based on mutation and crossover),及紧急情况下的实时分配方式RTBA(real-time batch assignment algorithm in emergency);同时基于障碍物维度划分的连续粒子群方法OD-CPSO(continuous particle swarm optimization based on obstacle dimension),通过个体借鉴群体信息的集群思想,搜寻并产生相应无人艇拦截入侵敌船的防御路径。尽管单个无人艇其负载能力有限,且防御行为简单,但是当它们组成群体进行协同操作时,往往能够呈现出复杂的智能行为。第三,构建基于深度强化学习的无人艇自主导航避障策略。无人艇在复杂海洋环境下执行各种任务时,其自主导航和避障是必不可少的重要组成部分,也是其智能性的重要体现。随着现代人工智能理论和技术的发展,尤其是深度学习和强化学习为自主智能控制发展注入了活力。因此本文提出基于强化学习的无人艇自主导航避障算法ANOA(autonomous navigation and obstacle avoidance algorithm based on reinforcement learning),通过马尔可夫决策过程进行问题建模,然后构建无人艇导航避障的仿真模拟环境,并利用深度强化学习算法来训练无人艇智能地完成导航避障任务。进一步地,在引入环境不确定性的基础上考虑障碍物的动态性特征,观察无人艇在所提算法策略的导引下,在不确定环境中的导航避障效果。同时设计相应的奖惩函数作为导航避障效果的反馈指标,反应该深度神经网络对导航避障能力拟合的效果质量。为验证算法所产生的导航避障策略的质量,所进行的实验对比论证了该方法的合理性和有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分