咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多智能体强化学习的大规模无人机集群对抗 收藏

基于多智能体强化学习的大规模无人机集群对抗

Large-scale UAVs Confrontation Based on Multi-agent Reinforcement Learning

作     者:王泊涵 吴婷钰 李文浩 黄达 金博 杨峰 周爱民 王祥丰 Wang Bohan;Wu Tingyu;Li Wenhao;Huang Da;Jin Bo;Yang Feng;Zhou Aimin;Wang Xiangfeng

作者机构:国防科技大学系统工程学院 华东师范大学计算机科学与技术学院 上海自主智能无人系统科学中心可信人工智能研究所 中国人民解放军军事科学院 

出 版 物:《系统仿真学报》 (Journal of System Simulation)

年 卷 期:2021年第33卷第8期

页      面:1739-1753页

核心收录:

学科分类:11[军事学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 1109[军事学-军事装备学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(12071145) 科技部新一代人工智能重大专项(2020AAA0107400) 之江实验室开放课题(2021KE0AB03) 

主  题:无人机集群 细粒度任务规划 多智能体强化学习 马尔可夫博弈 动态对抗 平均场 

摘      要:攻击成本低、体系生存率高且具备细粒度灵活作战能力的无人机集群作战未来将成为重要的战争形态。高效而适应性地对无人机集群进行细粒度任务规划,对提高集群作战效能具有重要意义。多智能体强化学习在解决群体序列决策任务时存在维度灾难及组合爆炸,多适用于小规模场景。将对抗环境中的无人机集群任务规划问题建模为马尔可夫博弈问题,基于平均场理论将大规模无人机间复杂交互过程建模为单机与集群平均影响间的交互,建立大规模集群对抗仿真环境,提出基于平均场的多智能体强化学习算法用于求解集群任务规划问题,其高效性和灵活性得到充分验证。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分