咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 边际最大化
  • 1 篇 逆向增强学习
  • 1 篇 回报函数
  • 1 篇 学徒学习
  • 1 篇 综述

机构

  • 1 篇 浙江大学

作者

  • 1 篇 钱徽
  • 1 篇 朱淼良
  • 1 篇 金卓军
  • 1 篇 陈沈轶

语言

  • 1 篇 中文
检索条件"主题词=边际最大化"
1 条 记 录,以下是1-10 订阅
排序:
基于回报函数逼近的学徒学习综述
收藏 引用
华中科技大学学报(自然科学版) 2008年 第S1期36卷 288-290,294页
作者: 金卓军 钱徽 陈沈轶 朱淼良 浙江大学计算机科学与技术学院 浙江杭州310027
回顾了基于回报函数逼近的学徒学习的发展历史,介绍了目前的主要工作,总结了学徒学习的一般方法,讨论了线性和非线性假设条件下的回报函数求解,比较了逆向增强学习(IRL)和边际最大化(MMP)两类逼近方法.基于IRL的学徒学习是一种通过迭代... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论