咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 2 篇 工学
    • 2 篇 航空宇航科学与技...
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 2 篇 双延迟深度确定性...
  • 2 篇 无人机
  • 2 篇 双策略网络
  • 1 篇 优先经验回放
  • 1 篇 自适应延迟更新机...

机构

  • 2 篇 陆军工程大学
  • 1 篇 南京信息职业技术...

作者

  • 2 篇 蒋方庆
  • 2 篇 陈自力
  • 2 篇 高喜俊
  • 1 篇 王春峰
  • 1 篇 张云
  • 1 篇 贺道坤

语言

  • 2 篇 中文
检索条件"主题词=双策略网络"
2 条 记 录,以下是1-10 订阅
排序:
基于改进TD3算法的无人机区域侦察研究
收藏 引用
飞行力学 2024年
作者: 蒋方庆 陈自力 高喜俊 张云 陆军工程大学
在执行区域侦察任务时,无人机需要更高性能的算法,以便对未知辐射源目标进行快速准确定位。利用改进的延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic Policy Gradient,TD3)实现无人机快速侦察目标。针对TD3算法... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于改进TD3算法的无人机决策研究
收藏 引用
信息化研究 2023年 第3期49卷 36-42页
作者: 蒋方庆 陈自力 高喜俊 王春峰 贺道坤 陆军工程大学石家庄校区 石家庄050003 南京信息职业技术学院智能制造学院 南京210023
针对无人机在执行打击任务时,对飞行区域的环境掌握甚少、飞行区域大、目标稀疏、火力威胁等相对不确定因素会导致任务的完成度低的问题。本文提出利用双策略网络延迟深度确定性策略梯度算法(TD3)进行改进,解决单策略动作波动大问... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论