咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 2 篇 机械工程
    • 1 篇 计算机科学与技术...
    • 1 篇 交通运输工程
    • 1 篇 软件工程

主题

  • 3 篇 路径规划
  • 3 篇 奖励指导
  • 3 篇 深度确定性策略梯...
  • 2 篇 优先经验回放
  • 2 篇 智能汽车
  • 1 篇 无人驾驶
  • 1 篇 决策控制

机构

  • 3 篇 河北工业大学

作者

  • 3 篇 陈建文
  • 2 篇 张小俊
  • 2 篇 张明路
  • 1 篇 赵天亮

语言

  • 3 篇 中文
检索条件"主题词=奖励指导"
3 条 记 录,以下是1-10 订阅
排序:
基于深度强化学习的无人驾驶路径规划研究
收藏 引用
河北工业大学学报 2024年 第4期53卷 21-30页
作者: 赵天亮 张小俊 张明路 陈建文 河北工业大学机械工程学院 天津300401
针对深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法在训练神经网络时出现收敛不稳定、学习效率低等问题,提出了一种基于奖励指导的深度确定性策略梯度(Reward Guidance DDPG,RG_DDPG)算法。该算法在回合内创建优秀... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度强化学习的无人驾驶路径规划算法研究
基于深度强化学习的无人驾驶路径规划算法研究
收藏 引用
作者: 陈建文 河北工业大学
学位级别:硕士
无人驾驶是当今人工智能技术热门应用场景之一,也是众多学者的研究热点。路径规划作为无人驾驶的关键技术之一,对推动智能汽车的快速发展起着重要作用。以往传统的控制决策算法大都是基于规则的,这种依靠人工经验构建的模型很难应对复... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
改进深度确定性策略梯度的决策算法研究
收藏 引用
汽车实用技术 2022年 第1期47卷 28-31页
作者: 陈建文 张小俊 张明路 河北工业大学机械工程学院 天津300400
为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、收敛不稳定等缺点,提出了基于奖励指导的改进算法。首先在每回合内采用基于奖励的优先级经验回放,减少深... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 博看期刊 评论