咨询与建议

限定检索结果

文献类型

  • 84 篇 学位论文
  • 82 篇 期刊文献
  • 3 篇 会议

馆藏范围

  • 169 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 167 篇 工学
    • 120 篇 计算机科学与技术...
    • 119 篇 控制科学与工程
    • 116 篇 软件工程
    • 42 篇 机械工程
    • 34 篇 仪器科学与技术
    • 12 篇 信息与通信工程
    • 11 篇 电子科学与技术(可...
    • 10 篇 交通运输工程
    • 6 篇 航空宇航科学与技...
    • 6 篇 兵器科学与技术
    • 5 篇 电气工程
    • 3 篇 船舶与海洋工程
    • 2 篇 公安技术
    • 1 篇 动力工程及工程热...
    • 1 篇 测绘科学与技术
    • 1 篇 地质资源与地质工...
    • 1 篇 生物医学工程(可授...
    • 1 篇 生物工程
  • 113 篇 管理学
    • 113 篇 管理科学与工程(可...
    • 2 篇 工商管理
    • 2 篇 公共管理
  • 7 篇 军事学
    • 4 篇 军队指挥学
    • 3 篇 战术学
    • 3 篇 军事装备学
  • 6 篇 理学
    • 3 篇 系统科学
    • 2 篇 数学
    • 1 篇 地理学
  • 2 篇 经济学
    • 2 篇 应用经济学
  • 2 篇 艺术学
    • 2 篇 设计学(可授艺术学...
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 医学

主题

  • 169 篇 分层强化学习
  • 28 篇 强化学习
  • 26 篇 深度强化学习
  • 17 篇 option
  • 15 篇 路径规划
  • 8 篇 自动分层
  • 8 篇 子目标
  • 8 篇 多智能体强化学习
  • 7 篇 人工智能
  • 6 篇 稀疏奖励
  • 6 篇 多智能体系统
  • 4 篇 马尔可夫决策过程
  • 4 篇 maxq
  • 4 篇 机器学习
  • 3 篇 机械臂
  • 3 篇 soft actor-criti...
  • 3 篇 移动机器人
  • 3 篇 免疫聚类
  • 3 篇 值函数分解
  • 3 篇 互信息

机构

  • 20 篇 哈尔滨工程大学
  • 12 篇 苏州大学
  • 7 篇 吉林大学
  • 7 篇 北京邮电大学
  • 6 篇 电子科技大学
  • 5 篇 华南理工大学
  • 5 篇 陆军工程大学
  • 5 篇 太原理工大学
  • 4 篇 北京交通大学
  • 4 篇 长沙理工大学
  • 3 篇 东南大学
  • 3 篇 国防科技大学
  • 3 篇 南京大学
  • 3 篇 南京邮电大学
  • 3 篇 广东石油化工学院
  • 3 篇 茂名学院
  • 3 篇 哈尔滨工业大学
  • 2 篇 华中科技大学
  • 2 篇 兰州理工大学
  • 2 篇 贵州师范大学

作者

  • 11 篇 刘海波
  • 11 篇 顾国昌
  • 11 篇 沈晶
  • 5 篇 刘全
  • 4 篇 程晓北
  • 4 篇 彭志平
  • 3 篇 曹雷
  • 3 篇 徐亚鹏
  • 2 篇 刘元归
  • 2 篇 闫其粹
  • 2 篇 赖俊
  • 2 篇 程晓明
  • 2 篇 柯文德
  • 2 篇 李绍平
  • 2 篇 伏玉琛
  • 2 篇 付成伟
  • 2 篇 王奇
  • 2 篇 王本年
  • 2 篇 禹春梅
  • 2 篇 张汝波

语言

  • 169 篇 中文
检索条件"主题词=分层强化学习"
169 条 记 录,以下是1-10 订阅
排序:
一种分层强化学习的知识推理方法
收藏 引用
计算机应用研究 2024年 第3期41卷 805-810页
作者: 孙崇 王海荣 荆博祥 马赫 北方民族大学计算机科学与工程学院 银川750021 北方民族大学图像图形智能处理国家民委重点实验室 银川750021
针对知识推理过程中,随着推理路径长度的增加,节点的动作空间急剧增长,使得推理难度不断提升的问题,提出一种分层强化学习的知识推理方法(knowledge reasoning method of hierarchical reinforcement learning,MutiAg-HRL),降低推理过... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
分层强化学习在无人机领域应用综述
收藏 引用
人工智能与机器人研究 2024年 第1期13卷 66-71页
作者: 杨永祥 王念杰 胡涵川 贵州师范大学数学科学学院 贵州 贵阳 日照市岚山区行政审批服务局 山东 日照 贵州师范大学大数据与科学学院 贵州 贵阳
分层强化学习强化学习领域的一个重要分支。基于分而治之的思想,将一个复杂问题分解成多个子问题,最终解决整个问题。近年来,由于传感器能力的提高和人工智能算法的进步,基于分层强化学习的无人机自主导航成为研究热点。本篇文章对国... 详细信息
来源: 维普期刊数据库 维普期刊数据库 评论
基于改进分层强化学习的无人驾驶自动超车决策算法研究
基于改进分层强化学习的无人驾驶自动超车决策算法研究
收藏 引用
作者: 赵家民 吉林大学
学位级别:硕士
随着自动驾驶技术的高速发展,汽车已经有着越来越高的自主程度。然而超车决策对于现有的自动驾驶技术来说,一直被认为是一项复杂且具有挑战的驾驶任务。因为它需要考虑合适的超车时机,足够的超车距离,还要避免碰撞的发生。因此,如何设... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于分层强化学习的复杂地形下轮式机器人导航方法研究
基于分层强化学习的复杂地形下轮式机器人导航方法研究
收藏 引用
作者: 王一帆 吉林大学
学位级别:硕士
近年来,机器人和人工智能技术的发展使得业界对更智能的轮式机器人的需求不断增长。这种需求在军事行动、救灾工作和地外空间探索等关键领域尤为明显。在这些领域,轮式机器人的工作环境通常是非结构化且复杂的,具有不平坦、崎岖的地形... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于分层强化学习的翼伞轨迹跟踪控制
基于分层强化学习的翼伞轨迹跟踪控制
收藏 引用
作者: 杨永祥 贵州师范大学
学位级别:硕士
无动力翼伞是一种依靠气流进行飞行的飞行装备,通过操作下拉左右后缘以实现转向。由于受外界环境干扰明显,精确稳定的实现翼伞系统的轨迹跟踪非常困难。强化学习旨在通过与环境的交互来学习如何做出最优决策。其中,分层强化学习作为其... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于分层强化学习的低过载比拦截制导律
收藏 引用
空天防御 2024年 第1期7卷 40-47页
作者: 王旭 蔡远利 张学成 张荣良 韩成龙 西安交通大学电子与信息学部 陕西西安710049 陆军装备部驻上海地区第三军事代表室 上海200031 上海机电工程研究所 上海201109
为解决低过载比和纯角度量测等约束下的三维机动目标拦截制导问题,提出了一种基于分层强化学习的拦截制导律。首先将问题建模为马尔科夫决策过程模型,并考虑拦截能量消耗与弹目视线角速率,设计了一种启发式奖赏函数。其次通过构建具有... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于分层强化学习的多智能体博弈策略生成方法
收藏 引用
无线电工程 2024年 第6期54卷 1361-1367页
作者: 畅鑫 李艳斌 刘东辉 中国电子科技集团公司第五十四研究所 河北石家庄050081 石家庄铁道大学管理学院 河北石家庄050043 石家庄铁道大学工程建设管理研究中心 河北石家庄050043
典型基于深度强化学习的多智能体对抗策略生成方法采用“分总”框架,各智能体基于部分可观测信息生成策略并进行决策,缺乏从整体角度生成对抗策略的能力,大大限制了决策能力。为了解决该问题,基于分层强化学习提出改进的多智能体博弈策... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 博看期刊 评论
基于分层强化学习的机器人自主避障算法仿真
收藏 引用
计算机仿真 2024年 第4期41卷 397-401页
作者: 安燕霞 郑晓霞 晋中信息学院智能工程学院 山西晋中030800 太原理工大学航空航天学院 山西太原030024
智能机器人可以实时感知周围环境信息,通过绘制环境地图控制行动轨迹,但是如何自主导航起点到终点的同时避开障碍物,获取最优路径的问题仍然需要进一步解决。为提高机器人路径规划能力,减少机器人与障碍物的碰撞概率,提出基于分层强化... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
分层强化学习研究综述
收藏 引用
模式识别与人工智能 2005年 第5期18卷 574-581页
作者: 沈晶 顾国昌 刘海波 哈尔滨工程大学计算机科学与技术学院 哈尔滨150001
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但是,强化学习一直被"维数灾"问题所困扰。近年来,分层强化学习方法引入抽象(Abstraction)机制,在克服"维数灾"方面取得了显... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于启发式奖赏函数的分层强化学习方法
收藏 引用
计算机研究与发展 2011年 第12期48卷 2352-2358页
作者: 刘全 闫其粹 伏玉琛 胡道京 龚声蓉 苏州大学计算机科学与技术学院 江苏苏州215006
针对强化学习在应用中经常出现的"维数灾"问题,即状态空间的大小随着特征数量的增加而发生指数级的增长,以及收敛速度过慢的问题,提出了一种基于启发式奖赏函数的分层强化学习方法.该方法不仅能够大幅度减少环境状态空间,还能加快学习... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论