咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 强化学习
  • 1 篇 深度强化学习
  • 1 篇 异步优势演员评论...
  • 1 篇 演员评论家模型
  • 1 篇 模型压缩

机构

  • 1 篇 辽宁师范大学

作者

  • 1 篇 任永功
  • 1 篇 张晶
  • 1 篇 王子铭

语言

  • 1 篇 中文
检索条件"主题词=异步优势演员评论家模型"
1 条 记 录,以下是1-10 订阅
排序:
A3C深度强化学习模型压缩及知识抽取
收藏 引用
计算机研究与发展 2023年 第6期60卷 1373-1384页
作者: 张晶 王子铭 任永功 辽宁师范大学计算机与人工智能学院 辽宁大连116081
异步优势演员评论家(asynchronous advantage actor-critic,A3C)构建一主多从异步并行深度强化学习框架,其在最优策略探索中存在求解高方差问题,使主智能体难以保证全局最优参数更新及最佳策略学习.同时,利用百万计算资源构建的大规模... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论