咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于自博弈深度强化学习的空战智能决策方法 收藏

基于自博弈深度强化学习的空战智能决策方法

作     者:单圣哲 张伟伟 

作者机构:中国人民解放军93995部队 西北工业大学航空学院 

出 版 物:《航空学报》 (Acta Aeronautica et Astronautica Sinica)

年 卷 期:2023年

核心收录:

学科分类:11[军事学] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 1109[军事学-军事装备学] 

基  金:国防科技重点实验室基金(6142219190302) 

主  题:空战 人工智能 深度强化学习 自博弈 智能体 

摘      要:空战是战争走向立体的重要环节,智能空战已经成为国内外军事领域的研究热点和重点,深度强化学习是实现空战智能化的重要技术途径。针对单智能训练方法难以构建高水平空战对手问题,提出基于自博弈的空战智能体训练方法,搭建研究平台,根据飞行员领域知识合理设计观测、动作与奖励,通过“左右互博方式训练空战智能体至收敛,并通过仿真实验验证空战决策模型的有效性。研究结果表明通过自博弈训练,空战智能体战术水平逐步提升,最终对单智能训练的决策模型构成70%以上胜率,并“涌现类似人类“单/双环战术的空战策略。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分