咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 航空宇航科学与技...
    • 1 篇 兵器科学与技术
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 中心化策略梯度分...
  • 1 篇 参数化动作空间
  • 1 篇 多巡航导弹突防
  • 1 篇 多智能体强化学习

机构

  • 1 篇 国防科技大学
  • 1 篇 计算机软件新技术...
  • 1 篇 西南交通大学

作者

  • 1 篇 周正春
  • 1 篇 张远龙
  • 1 篇 谢愈
  • 1 篇 田树聪
  • 1 篇 高阳

语言

  • 1 篇 中文
检索条件"主题词=多巡航导弹突防"
1 条 记 录,以下是1-10 订阅
排序:
面向参数化动作空间的智能体中心化策略梯度分解及其应用
收藏 引用
软件学报 2024年
作者: 田树聪 谢愈 张远龙 周正春 高阳 西南交通大学信息科学与技术学院 国防科技大学智能科学学院 计算机软件新技术国家重点实验室(南京大学)
近年来,智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的决策能力以及广泛的应用前景.在真实环境的智能体决策系统中,其任务的决策空间往往是同时具有离散型动作变量和连续型动作变量的参数化... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论