咨询与建议

限定检索结果

文献类型

  • 1 篇 学位论文

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 无遗憾学习
  • 1 篇 博弈论
  • 1 篇 在线学习
  • 1 篇 强化学习

机构

  • 1 篇 中山大学

作者

  • 1 篇 胡超豪

语言

  • 1 篇 中文
检索条件"主题词=无遗憾学习"
1 条 记 录,以下是1-10 订阅
排序:
基于在线学习和演化博弈的强化学习方法研究
基于在线学习和演化博弈的强化学习方法研究
收藏 引用
作者: 胡超豪 中山大学
学位级别:硕士
随着强化学习应用场景不断深化,通常存在多个互联互通的智能体共同作用同一环境。多智能体并发学习使得智能体面临非稳态环境,给智能体决策带来极大挑战。博弈论作为研究多智能体交互及理性决策的学科,通过对智能体的决策目标与交互规... 详细信息
来源: 同方学位论文库 同方学位论文库 评论