咨询与建议

限定检索结果

文献类型

  • 98 篇 期刊文献
  • 65 篇 学位论文
  • 1 篇 会议

馆藏范围

  • 164 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 154 篇 工学
    • 70 篇 计算机科学与技术...
    • 66 篇 软件工程
    • 57 篇 控制科学与工程
    • 35 篇 机械工程
    • 23 篇 仪器科学与技术
    • 18 篇 交通运输工程
    • 17 篇 电气工程
    • 10 篇 信息与通信工程
    • 9 篇 动力工程及工程热...
    • 7 篇 电子科学与技术(可...
    • 7 篇 航空宇航科学与技...
    • 4 篇 公安技术
    • 4 篇 网络空间安全
    • 3 篇 水利工程
    • 2 篇 材料科学与工程(可...
    • 2 篇 土木工程
    • 2 篇 船舶与海洋工程
    • 1 篇 兵器科学与技术
    • 1 篇 农业工程
    • 1 篇 城乡规划学
  • 67 篇 管理学
    • 66 篇 管理科学与工程(可...
    • 3 篇 工商管理
  • 12 篇 理学
    • 6 篇 数学
    • 6 篇 系统科学
    • 1 篇 大气科学
  • 5 篇 经济学
    • 5 篇 应用经济学
  • 2 篇 法学
    • 2 篇 公安学
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 农学
    • 1 篇 农业资源与环境
  • 1 篇 军事学
    • 1 篇 战术学
  • 1 篇 艺术学

主题

  • 164 篇 q学习算法
  • 29 篇 强化学习
  • 15 篇 路径规划
  • 7 篇 多智能体
  • 6 篇 移动机器人
  • 5 篇 多目标优化
  • 5 篇 粒子群算法
  • 4 篇 深度强化学习
  • 4 篇 无人机
  • 3 篇 集装箱码头
  • 3 篇 dqn算法
  • 3 篇 人工智能
  • 3 篇 mas
  • 3 篇 博弈论
  • 3 篇 蚁群算法
  • 3 篇 多agent系统
  • 3 篇 集成仿真平台
  • 3 篇 马氏决策过程
  • 3 篇 智能体
  • 3 篇 动态调度

机构

  • 7 篇 南京邮电大学
  • 7 篇 北京工业大学
  • 5 篇 华南理工大学
  • 5 篇 广东工业大学
  • 4 篇 重庆交通大学
  • 4 篇 长沙理工大学
  • 4 篇 上海交通大学
  • 4 篇 哈尔滨工业大学
  • 4 篇 电子科技大学
  • 3 篇 北京交通大学
  • 3 篇 暨南大学
  • 3 篇 兰州交通大学
  • 3 篇 东南大学
  • 3 篇 西安电子科技大学
  • 3 篇 北京理工大学
  • 3 篇 合肥工业大学
  • 3 篇 北京化工大学
  • 2 篇 电网智能化调度与...
  • 2 篇 华中科技大学
  • 2 篇 大连理工大学

作者

  • 4 篇 杨明
  • 3 篇 赵晓华
  • 3 篇 于泉
  • 3 篇 默凡凡
  • 3 篇 张刘锋
  • 3 篇 李振龙
  • 3 篇 余涛
  • 3 篇 乔林
  • 2 篇 张俊
  • 2 篇 吴沧浦
  • 2 篇 罗杰
  • 2 篇 李大字
  • 2 篇 蒋国飞
  • 2 篇 朱丽娜
  • 2 篇 陈焕文
  • 2 篇 谢丽娟
  • 2 篇 刘勇
  • 2 篇 王明强
  • 2 篇 马什鹏
  • 2 篇 刘元元

语言

  • 164 篇 中文
检索条件"主题词=Q学习算法"
164 条 记 录,以下是1-10 订阅
排序:
基于q学习算法的变论域模糊控制新算法
收藏 引用
控制理论与应用 2011年 第11期28卷 1645-1650页
作者: 余涛 于文俊 李章文 华南理工大学电力学院 广东广州510640 湖南电力公司永州电业局 湖南永州425000
变论域模糊控制器的控制函数被"复制"到后代中,往往存在着"失真"现象,这种现象的后果是造成算法本身的误差.针对这一问题,本文提出了一种基于q学习算法的变论域模糊控制优化设计方法.本算法在变论域模糊控制算法基础上提出了一种利用伸... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于改进q学习算法和组合模型的超短期电力负荷预测
收藏 引用
电力系统保护与控制 2024年 第9期52卷 143-153页
作者: 张丽 李世情 艾恒涛 张涛 张宏伟 河南理工大学电气工程与自动化学院 河南焦作454003 河南省煤矿装备智能检测与控制重点实验室 河南焦作454003 国网山西省电力公司临汾供电公司 山西临汾041000
单一模型在进行超短期负荷预测时会因负荷波动而导致预测精度变差,针对此问题,提出一种基于深度学习算法的组合预测模型。首先,采用变分模态分解对原始负荷序列进行分解,得到一系列的子序列。其次,分别采用双向长短期记忆网络和优化后的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 博看期刊 同方期刊数据库 同方期刊数据库 评论
基于q学习算法的摘挂列车调车作业计划优化
收藏 引用
中国铁道科学 2022年 第1期43卷 163-170页
作者: 施俊庆 陈林武 林柏梁 孟国连 夏顺娅 浙江师范大学工学院 浙江金华321004 浙江师范大学 浙江省城市轨道交通智能运维技术与装备重点实验室浙江金华321004 北京交通大学交通运输学院 北京100044
针对摘挂列车编组调车作业计划编制问题,基于强化学习技术和q学习算法,提出1种调车作业计划优化方法。在表格调车法的基础上,将调车作业计划分为下落和重组2个部分。通过动作、状态和奖励3要素构建调车作业问题的强化学习模型,以调车机... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
状态翻转控制下布尔控制网络的可镇定性和q学习算法
收藏 引用
控制理论与应用 2021年 第11期38卷 1743-1753页
作者: 刘洋 刘泽娇 卢剑权 浙江师范大学数学与计算机科学学院 浙江金华321004 浙江师范大学数理医学院 浙江金华321004 金华市智能制造研究院 浙江金华321032 东南大学数学学院 江苏南京210096
在给定一个子集的条件下,本文研究了在状态翻转控制下布尔控制网络的全局镇定问题.对于节点集的给定子集,状态翻转控制可以将某些节点的值从1(或0)变成0(或1).将翻转控制作为控制之一,本文研究了状态翻转控制下的布尔控制网络.将控制输... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
q学习算法中网格离散化方法的收敛性分析
收藏 引用
控制理论与应用 1999年 第2期16卷 194-198页
作者: 蒋国飞 高慧琪 吴沧浦 北京理工大学自动控制系 北京100081
q学习算法是Watkins[1] 提出的求解信息不完全马尔可夫决策问题的一种强化学习方法 .要用q学习算法来求解有连续状态和决策空间的随机最优控制问题 ,则需要先离散化问题的状态和决策空间 .在本文中 ,我们证明了在满足一定的Lipschitz连... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于q学习算法的两交叉口信号灯博弈协调控制
收藏 引用
系统仿真学报 2007年 第18期19卷 4253-4256页
作者: 赵晓华 李振龙 于泉 荣建 北京工业大学北京市交通工程重点实验室 北京100022 北京工业大学电子信息与控制工程学院 北京100022
q学习和博弈论相结合解决相邻两交叉口信号灯协调控制问题。在基本q学习算法的基础上引入博弈论,以q值作为赢得函数建立赢得矩阵。相邻两交叉口之间的协调关系属于二人非零和合作博弈,采用Nash公理方法求得其谈判解,并以此作为q学习策... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于q学习算法的综合能源系统韧性提升方法
收藏 引用
电力自动化设备 2020年 第4期40卷 146-152页
作者: 吴熙 唐子逸 徐青山 周亦洲 东南大学电气工程学院 江苏南京210096 河海大学能源与电气学院 江苏南京210098
将综合能源系统随机动态优化问题建模为马尔可夫决策过程,并引入q学习算法实现该复杂问题的求解。针对q学习算法的弊端,对传统的q学习算法做了2个改进:改进了q值表初始化方法,采用置信区间上界算法进行动作选择。仿真结果表明:q学习算... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
q学习算法在库存控制中的应用
收藏 引用
自动化学报 1999年 第2期25卷 236-241页
作者: 蒋国飞 吴沧浦 北京理工大学自动控制系
学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.这里提出了一种新的探索策略,并将该策略和Q学习算法有效结合来求解一类典型的有连续状态和决策空间的库存控制问题.仿真表明,该方法所求解的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于预测状态表示的q学习算法
收藏 引用
西安交通大学学报 2008年 第12期42卷 1472-1475,1485页
作者: 刘云龙 李人厚 刘建书 西安交通大学系统工程研究所 西安710049
针对不确定环境的规划问题,提出了基于预测状态表示的q学习算法.将预测状态表示方法与q学习算法结合,用预测状态表示的预测向量作为q学习算法的状态表示,使得到的状态具有马尔可夫特性,满足强化学习任务的要求,进而用q学习算法学习智能... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
集装箱码头集卡调度模型与q学习算法
收藏 引用
哈尔滨工程大学学报 2008年 第1期29卷 1-4页
作者: 曾庆成 杨忠振 大连海事大学交通工程与物流学院 辽宁大连116026
研究集装箱码头装卸过程中集卡调度问题,建立了集卡调度动态模型,目的是使装卸桥等待时间最小.设计了基于q学习算法的求解方法,获得在不同状态下的集卡调度策略.提出了应用q学习算法求解集卡最优调度时系统状态、动作规则、学习步长与... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论