咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 人类建议
  • 1 篇 人类示范
  • 1 篇 强化学习
  • 1 篇 人类先验知识
  • 1 篇 人类反馈

机构

  • 1 篇 国防科技大学

作者

  • 1 篇 许乃夫
  • 1 篇 国子婧
  • 1 篇 冯旸赫
  • 1 篇 姚晨蝶

语言

  • 1 篇 中文
检索条件"主题词=人类示范"
1 条 记 录,以下是1-10 订阅
排序:
基于人类先验知识的强化学习综述
收藏 引用
计算机应用 2021年 第S2期41卷 1-4页
作者: 国子婧 冯旸赫 姚晨蝶 许乃夫 国防科技大学系统工程学院 长沙410072
强化学习通过智能体与环境互动以实现预期目标最大化,通常被用于解决关于连续决策的任务规划问题。当前任务规划主要使用规则或者运筹方法进行求解。这类方法的时间复杂度和空间复杂度随问题规模增长呈指数级增长,难以求解大规模问题;... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论