海空跨域协同兵棋AI架构设计及关键技术分析
Architecture design and key technologies analysis of wargaming AI for sea⁃air cross⁃domain coordination作者机构:国防科技大学智能科学学院湖南长沙410073
出 版 物:《指挥控制与仿真》 (Command Control & Simulation)
年 卷 期:2024年第46卷第2期
页 面:35-43页
学科分类:11[军事学] 1109[军事学-军事装备学]
基 金:国家自然科学基金(61806212、62376280)
主 题:海空兵棋 跨域协同 兵棋推演 多智能体 智能博弈 模型架构 分层强化学习
摘 要:以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈模型,分析了相关的均衡解概念;在分析典型智能体框架基础上,针对海空兵棋推演决策博弈过程,提出基于多智能体分层强化学习的智能体双层架构,能够有效解决智能体间协作和维度灾难问题;从兵力协同、智能体网络设计、对手建模和训练机制共4个方面分析了关键技术。期望为海空兵棋AI设计实现提供架构指导。