基于强化学习的多智能体协同电子对抗方法
Multi-agent cooperative electronic countermeasure method based on reinforcement learning作者机构:中国科学院长春光学精密机械与物理研究所长春130033 中国科学院大学北京100049 光电对抗测试评估技术重点实验室河南洛阳471000
出 版 物:《兵器装备工程学报》 (Journal of Ordnance Equipment Engineering)
年 卷 期:2024年第45卷第7期
页 面:1-10页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:传统电子战正逐步向融合人工智能技术的智能电子战演变,基于强化学习的多无人机电子协同对抗为主要场景,针对复杂高维的状态动作空间下多智能体强化学习算法不容易收敛问题,提出了一种基于优先经验回放的多智能体双对抗策略梯度算法。该算法通过引入优先经验回放机制,并提出对抗Critic网络和双Critic网络来平衡动作及价值间的关系和减小单一Critic网络估计不确定性的问题。仿真实验结果表明:在同一仿真场景下相较于其他强化学习算法,PerMaD4算法具有更好的收敛效果且任务完成度提高了8.9%。