基于深度强化学习的立体投送策略优化方法研究
Strategy Optimization Method of Multi-dimension Projection Based on Deep Reinforcement Learning作者机构:国防大学联合勤务学院北京100858 国防大学研究生院北京100091 国防大学联合作战学院北京100091
出 版 物:《系统仿真学报》 (Journal of System Simulation)
年 卷 期:2024年第36卷第1期
页 面:39-49页
核心收录:
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:深度强化学习 仿真推演 策略优化 立体投送 A3C算法
摘 要:基于深度强化学习算法在策略优化问题中的良好表现,以立体投送作战行动为主要研究对象,提出了一种深度强化学习框架与仿真推演实验协同的作战行动策略优化方法。在分析策略优化研究现状的基础上,根据研究问题对深度学习框架进行了分析比较,构建了基于A3C算法的深度强化学习立体投送策略模型,并通过仿真推演和分布式计算,实现深度强化学习模型与“人不在回路仿真推演的交互学习,获得优化后的立体投送策略,验证了深度强化学习框架与仿真推演实验协同优化策略的有效性。