咨询与建议

限定检索结果

文献类型

  • 84 篇 学位论文
  • 82 篇 期刊文献
  • 3 篇 会议

馆藏范围

  • 169 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 167 篇 工学
    • 120 篇 计算机科学与技术...
    • 119 篇 控制科学与工程
    • 116 篇 软件工程
    • 42 篇 机械工程
    • 34 篇 仪器科学与技术
    • 12 篇 信息与通信工程
    • 11 篇 电子科学与技术(可...
    • 10 篇 交通运输工程
    • 6 篇 航空宇航科学与技...
    • 6 篇 兵器科学与技术
    • 5 篇 电气工程
    • 3 篇 船舶与海洋工程
    • 2 篇 公安技术
    • 1 篇 动力工程及工程热...
    • 1 篇 测绘科学与技术
    • 1 篇 地质资源与地质工...
    • 1 篇 生物医学工程(可授...
    • 1 篇 生物工程
  • 113 篇 管理学
    • 113 篇 管理科学与工程(可...
    • 2 篇 工商管理
    • 2 篇 公共管理
  • 7 篇 军事学
    • 4 篇 军队指挥学
    • 3 篇 战术学
    • 3 篇 军事装备学
  • 6 篇 理学
    • 3 篇 系统科学
    • 2 篇 数学
    • 1 篇 地理学
  • 2 篇 经济学
    • 2 篇 应用经济学
  • 2 篇 艺术学
    • 2 篇 设计学(可授艺术学...
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 医学

主题

  • 169 篇 分层强化学习
  • 28 篇 强化学习
  • 26 篇 深度强化学习
  • 17 篇 option
  • 15 篇 路径规划
  • 8 篇 自动分层
  • 8 篇 子目标
  • 8 篇 多智能体强化学习
  • 7 篇 人工智能
  • 6 篇 稀疏奖励
  • 6 篇 多智能体系统
  • 4 篇 马尔可夫决策过程
  • 4 篇 maxq
  • 4 篇 机器学习
  • 3 篇 机械臂
  • 3 篇 soft actor-criti...
  • 3 篇 移动机器人
  • 3 篇 免疫聚类
  • 3 篇 值函数分解
  • 3 篇 互信息

机构

  • 20 篇 哈尔滨工程大学
  • 12 篇 苏州大学
  • 7 篇 吉林大学
  • 7 篇 北京邮电大学
  • 6 篇 电子科技大学
  • 5 篇 华南理工大学
  • 5 篇 陆军工程大学
  • 5 篇 太原理工大学
  • 4 篇 北京交通大学
  • 4 篇 长沙理工大学
  • 3 篇 东南大学
  • 3 篇 国防科技大学
  • 3 篇 南京大学
  • 3 篇 南京邮电大学
  • 3 篇 广东石油化工学院
  • 3 篇 茂名学院
  • 3 篇 哈尔滨工业大学
  • 2 篇 华中科技大学
  • 2 篇 兰州理工大学
  • 2 篇 贵州师范大学

作者

  • 11 篇 刘海波
  • 11 篇 顾国昌
  • 11 篇 沈晶
  • 5 篇 刘全
  • 4 篇 程晓北
  • 4 篇 彭志平
  • 3 篇 曹雷
  • 3 篇 徐亚鹏
  • 2 篇 刘元归
  • 2 篇 闫其粹
  • 2 篇 赖俊
  • 2 篇 程晓明
  • 2 篇 柯文德
  • 2 篇 李绍平
  • 2 篇 伏玉琛
  • 2 篇 付成伟
  • 2 篇 王奇
  • 2 篇 王本年
  • 2 篇 禹春梅
  • 2 篇 张汝波

语言

  • 169 篇 中文
检索条件"主题词=分层强化学习"
169 条 记 录,以下是41-50 订阅
排序:
基于分层强化学习的数字化输电线路路径规划研究
收藏 引用
电测与仪表 2022年 第4期59卷 91-97页
作者: 宋涛 李丹 路宁 国家电网有限公司特高压建设分公司 北京100052 北京道亨软件股份有限公司 北京100012
在输电线路的设计中,使用三维数字化设计技术可以显著提升地形的划分精度,然而地形划分精度的提升会使得地形栅格矩阵维度呈指数级增加,导致路径规划过程中出现维度灾难问题。为解决该问题,研究了一种基于分层强化学习的数字化输电线路... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于加权值函数分解的多智能体分层强化学习技能发现方法
收藏 引用
计算机应用研究 2023年 第9期40卷 2743-2748,2754页
作者: 邹启杰 李文雪 高兵 赵锡玲 张汝波 大连大学信息工程学院 辽宁大连116622 大连民族大学机电工程学院 辽宁大连116600
针对目前大多数多智能体强化学习算法在智能体数量增多以及环境动态不稳定的情况下导致的维度爆炸和奖励稀疏的问题,提出了一种基于加权值函数分解的多智能体分层强化学习技能发现算法。首先,该算法将集中训练分散执行的架构与分层强化... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于轨迹信息量的分层强化学习方法
收藏 引用
计算机科学 2023年 第12期50卷 314-321页
作者: 徐亚鹏 刘全 栗军伟 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006
基于option的分层强化学习(The Option-Based Hierarchical Reinforcement Learning,O-HRL)算法具有时序抽象的特点,可以有效处理强化学习中难以解决的长时序、稀疏奖励等复杂问题。目前O-HRL方法的研究主要集中在数据效率提升方面,通... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
用于分层强化学习的最小k-聚类算法
收藏 引用
合肥工业大学学报(自然科学版) 2006年 第5期29卷 533-535页
作者: 王本年 铜陵学院计算机科学与技术系 安徽铜陵244000
学习过程中自动发现有用的Subgoal,对于分层强化学习有着重要的意义。文章提出了一种最小k-聚类算法,该算法能通过对在线获取的少量路径数据进行聚类的方法,抽取出有用的Subgoal;实验表明,该算法能有效地发现所有符合要求的Subgoal,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
多agent分层强化学习在数据定位中的应用研究
收藏 引用
计算机应用研究 2020年 第12期37卷 3635-3639页
作者: 洪壮壮 万仲保 张薇 黄兆华 华东交通大学软件学院 南昌330013
为了在领域文本中实现数据定位,将文本视为环境,针对文本环境中存在的动态性以及不确定性等问题,提出了基于多agent分层强化学习的数据定位方法。该方法利用分层结构的特点,将系统任务分解为多个子任务,个体agent分别对对应子任务学习,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于分层强化学习的联合作战仿真作战决策算法
收藏 引用
火力与指挥控制 2021年 第10期46卷 140-146页
作者: 于博文 吕明 张捷 南京理工大学 南京210094
如何对复杂装备体系进行有效的认知决策,一直以来都是联合作战研究领域中的热点与难点,采用一种具有较强适应性的决策算法,对于应对战场突发状况具有重要意义。通过结合近端策略优化和分层强化学习,提出了一种基于分层强化学习的联合作... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于分层强化学习的智能化攻击路径发现方法
收藏 引用
计算机科学 2023年 第7期50卷 308-316页
作者: 曾庆伟 张国敏 邢长友 宋丽华 陆军工程大学指挥控制工程学院 南京210007
智能化攻击路径发现是开展自动化渗透测试的一项关键技术,但现有方法面临着状态、动作空间呈指数型增长和奖励稀疏等问题,导致算法难以收敛。为此,提出了一种基于分层强化学习的智能化攻击路径发现方法iPathD(Intelligent Path Discove... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于动作抽象的分层强化学习算法研究
基于动作抽象的分层强化学习算法研究
收藏 引用
作者: 许志鹏 苏州大学
学位级别:硕士
强化学习可以通过与环境交互完成自主学习与优化,是一类重要的机器学习方法。然而强化学习也存在若干难点亟待解决,如“维数灾难”问题,在提高算法效果的前提下同时提高算法效率等。作为强化学习中的一个重要领域,分层强化学习学习任... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于技能发现的多任务分层强化学习研究
基于技能发现的多任务分层强化学习研究
收藏 引用
作者: 丁矾 苏州大学
学位级别:硕士
强化学习被广泛应用在机器人控制等领域,并取得了优异的表现。但其仍受大规模空间、样本利用率低、奖励稀疏延迟和泛化性差等问题的困扰。在多任务场景下,这些问题不仅变得更为严重,而且带来了新的问题-灾难性遗忘。分层强化学习通过将... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
能量收集无线通信中基于分层强化学习的接入控制策略研究
能量收集无线通信中基于分层强化学习的接入控制策略研究
收藏 引用
作者: 王英恺 合肥工业大学
学位级别:硕士
无线通信系统中所使用的能量收集技术特指从其所处的周围环境中收集绿色可再生能量以供自身所使用的技术。在无线通信系统中应用能量收集技术不仅可以使其摆脱对有限电缆的依赖,同时也降低无线通信网络的运营成本并且减少传统能源消耗... 详细信息
来源: 同方学位论文库 同方学位论文库 评论