咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 2 篇 工学
    • 1 篇 机械工程
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 2 篇 柔性演员评论家算...
  • 1 篇 深度强化学习
  • 1 篇 移动机器人
  • 1 篇 动态避障
  • 1 篇 内在好奇心
  • 1 篇 卷积神经网络
  • 1 篇 强化学习
  • 1 篇 样本利用效率

机构

  • 1 篇 西华师范大学
  • 1 篇 北京理工大学

作者

  • 1 篇 邵康康
  • 1 篇 王佳惠
  • 1 篇 徐建华
  • 1 篇 赵海军
  • 1 篇 刘学聪
  • 1 篇 胡仕柯

语言

  • 2 篇 中文
检索条件"主题词=柔性演员评论家算法"
2 条 记 录,以下是1-10 订阅
排序:
基于改进柔性演员评论家算法的研究
收藏 引用
太原师范学院学报(自然科学版) 2021年 第3期20卷 48-52页
作者: 胡仕柯 赵海军 西华师范大学计算机学院 四川南充637000
针对柔性演员评论家算法训练速度慢且训练过程不稳定的问题,提出了一种改进柔性演员评论家算法.通过在原有算法中引入内在好奇心机制,提高智能体探索能力与样本利用效率,并在仿真环境中用于求解倒立摆问题,实验结果表明文章算法具有更... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于改进强化学习的移动机器人动态避障方法
收藏 引用
中国惯性技术学报 2023年 第1期31卷 92-99页
作者: 徐建华 邵康康 王佳惠 刘学聪 北京理工大学自动化学院 北京100081
针对未知环境下移动机器人动态避障存在规划轨迹长、行驶速度慢和鲁棒性差等问题,提出一种基于改进强化学习的移动机器人动态避障方法。移动机器人根据自身速度、目标位置和激光雷达信息直接得到动作信号,实现端到端的控制。基于距离梯... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论