咨询与建议

限定检索结果

文献类型

  • 1 篇 学位论文

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 先验知识
  • 1 篇 奖励塑造
  • 1 篇 强化学习
  • 1 篇 军事智能博弈
  • 1 篇 抽象mdp模型

机构

  • 1 篇 国防科技大学

作者

  • 1 篇 陈晓轩

语言

  • 1 篇 中文
检索条件"主题词=军事智能博弈"
1 条 记 录,以下是1-10 订阅
排序:
先验知识启发的Q-learning势能奖励在线学习技术
先验知识启发的Q-learning势能奖励在线学习技术
收藏 引用
作者: 陈晓轩 国防科技大学
学位级别:硕士
近年来强化学习算法飞速发展,其应用领域涵盖了游戏AI、无人机集群控制、自然语言处理等。强化学习研究在取得进步的同时,也面临着许多问题和挑战。奖励稀疏问题是强化学习算法面临的主要挑战之一,在机器人控制、无人驾驶等现实问题中... 详细信息
来源: 同方学位论文库 同方学位论文库 评论