咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 状态采样策略
  • 1 篇 状态价值函数
  • 1 篇 二阶价值梯度
  • 1 篇 模型强化学习
  • 1 篇 工业过程控制

机构

  • 1 篇 中国科学院机器人...
  • 1 篇 中国科学院大学
  • 1 篇 中国科学院沈阳自...
  • 1 篇 中国科学院网络化...

作者

  • 1 篇 张博
  • 1 篇 李帅
  • 1 篇 潘福成
  • 1 篇 周晓锋

语言

  • 1 篇 中文
检索条件"主题词=二阶价值梯度"
1 条 记 录,以下是1-10 订阅
排序:
基于二阶价值梯度模型强化学习的工业过程控制方法
收藏 引用
计算机应用研究 2024年 第8期41卷 2434-2440页
作者: 张博 潘福成 周晓锋 李帅 中国科学院网络化控制系统重点实验室 沈阳110016 中国科学院沈阳自动化研究所 沈阳110016 中国科学院机器人与智能制造创新研究院 沈阳110169 中国科学院大学 北京100049
为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数逼近能力和更高的鲁棒性,学... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 同方期刊数据库 同方期刊数据库 评论