咨询与建议

限定检索结果

文献类型

  • 7 篇 学位论文
  • 2 篇 期刊文献

馆藏范围

  • 9 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 9 篇 工学
    • 5 篇 计算机科学与技术...
    • 4 篇 控制科学与工程
    • 4 篇 软件工程
    • 3 篇 仪器科学与技术
    • 2 篇 机械工程
    • 2 篇 交通运输工程
    • 1 篇 电气工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 航空宇航科学与技...
    • 1 篇 农业工程
  • 5 篇 管理学
    • 5 篇 管理科学与工程(可...
  • 1 篇 理学
    • 1 篇 数学
  • 1 篇 军事学
    • 1 篇 军事装备学

主题

  • 9 篇 double dqn
  • 4 篇 深度强化学习
  • 2 篇 纳什均衡
  • 2 篇 交通信号配时
  • 1 篇 隐蔽接敌
  • 1 篇 经验池技术
  • 1 篇 双模式多目标
  • 1 篇 攻防对抗决策
  • 1 篇 分布式马尔可夫决...
  • 1 篇 sumo
  • 1 篇 围捕
  • 1 篇 多代理
  • 1 篇 无人机
  • 1 篇 q-learning
  • 1 篇 倾摆控制
  • 1 篇 深度确定性策略梯...
  • 1 篇 非完备信息博弈
  • 1 篇 贪婪策略
  • 1 篇 ddpg
  • 1 篇 非平坦地形

机构

  • 1 篇 南京林业大学
  • 1 篇 国防科技大学
  • 1 篇 北京林业大学
  • 1 篇 武汉科技大学
  • 1 篇 南昌大学
  • 1 篇 北京工业大学
  • 1 篇 南瑞集团有限公司
  • 1 篇 智能信息处理与实...
  • 1 篇 沈阳理工大学
  • 1 篇 国电南瑞科技股份...
  • 1 篇 南京航空航天大学

作者

  • 1 篇 李宁峰
  • 1 篇 张明萱
  • 1 篇 高宇
  • 1 篇 杨枫
  • 1 篇 李昀
  • 1 篇 张可新
  • 1 篇 聂雷
  • 1 篇 雷捷维
  • 1 篇 高铭泽
  • 1 篇 孙彪
  • 1 篇 曹蓉蓉
  • 1 篇 鲍海洲
  • 1 篇 黄庆涵
  • 1 篇 葛振
  • 1 篇 何金
  • 1 篇 袁森

语言

  • 9 篇 中文
检索条件"主题词=Double DQN"
9 条 记 录,以下是1-10 订阅
排序:
基于double dqn的双模式多目标信号配时方法
收藏 引用
计算机技术与发展 2024年 第8期34卷 143-150页
作者: 聂雷 张明萱 黄庆涵 鲍海洲 武汉科技大学计算机科学与技术学院 湖北武汉430065 智能信息处理与实时工业系统湖北省重点实验室 湖北武汉430065
近年来深度强化学习作为一种高效可靠的机器学习方法被广泛应用在交通信号控制领域。目前,现有交通信号配时方法通常忽略了特殊车辆(例如救护车、消防车等)的优先通行;此外,基于传统深度强化学习的信号配时方法优化目标较为单一,导致其... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于多代理double dqn算法模拟发电侧竞价行为
收藏 引用
电网技术 2020年 第11期44卷 4175-4182页
作者: 高宇 李昀 曹蓉蓉 李宁峰 高铭泽 国电南瑞科技股份有限公司 江苏省南京市211106 南瑞集团有限公司(国网电力科学研究院有限公司) 江苏省南京市211106
强化学习已经成为研究发电侧竞价策略的重要方法,而Q-Learning算法的Q-table维度问题是限制其应用在发电侧竞价策略的主要原因,为此文章采用智能多代理double dqn(doubledeepq-learningnetwork,Ddqn)算法进行研究。Ddqn算法采用神经网... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度强化学习的交通配时优化技术研究
基于深度强化学习的交通配时优化技术研究
收藏 引用
作者: 张可新 沈阳理工大学
学位级别:硕士
因为我国经济的高速发展、人民收入水平随之的不断提高、全球城市化进程的不断加速,导致城市路网中车辆数量在一个较大的基数上持续增加。除此之外,在高品质生活下的日常活动中,很多方面也增加了城市路网中的车辆数量。城市路网中车辆... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
面向分散计算的任务调度技术研究
面向分散计算的任务调度技术研究
收藏 引用
作者: 袁森 国防科技大学
学位级别:硕士
在过去一段时间里,云计算作为主要的计算范式在提供按需配置的、位置无关的以及延迟容忍的服务方面占据了主导地位。随着边缘计算和雾计算的兴起,一部分计算也开始卸载到网络边缘执行。但随着5G以及物联网的进一步推进,海量的数据在网... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
B5G端到端网络切片场景中的智能切换算法研究
B5G端到端网络切片场景中的智能切换算法研究
收藏 引用
作者: 杨枫 北京工业大学
学位级别:硕士
随着B5G通信系统中新业务的爆炸式增长,网络切片已成为满足差异化业务需求的重要解决方案。网络切片基于软件定义网络(Software Defined Networking,SDN)和网络功能虚拟化(Network Function Virtualization,NFV)技术实现。一个物理网络... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于深度强化学习的无人机空战攻防对抗决策方法研究
基于深度强化学习的无人机空战攻防对抗决策方法研究
收藏 引用
作者: 何金 南京航空航天大学
学位级别:硕士
随着无人机技术的发展,对无人机空战攻防对抗决策提出了新的要求。本文以深度强化学习为基础,对复杂空战环境下的无人机空战攻防对抗决策方法进行了研究,主要研究内容包括:针对未知环境下的无人机隐蔽接敌问题,提出了一种基于PRB-Ddqn... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
履带式林地林木信息采集机器人路径规划研究
履带式林地林木信息采集机器人路径规划研究
收藏 引用
作者: 孙彪 北京林业大学
学位级别:硕士
传统机器人路径规划主要应用场景在室内或者室外平缓路面,对机器人运动要求较低。林区山地中路径规划需要综合考虑地形、地物等因素,且林区山地中障碍物分布具有随机性、不均匀性等特点,使得机器人在复杂环境中的路径规划问题变得非常... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于强化学习与博弈树搜索的非完备信息博弈算法的研究与应用
基于强化学习与博弈树搜索的非完备信息博弈算法的研究与应用
收藏 引用
作者: 雷捷维 南昌大学
学位级别:硕士
博弈问题存在于人们生活的各个方面,根据参与者对博弈信息掌握程度的不同,可以把博弈问题分为完备信息博弈和非完备信息博弈两类。在现实生活中,人们往往很难获取到所有的博弈信息,因此很多博弈问题,比如商业谈判、广告定价、军事推演... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于深度强化学习和倾摆技术的汽车路径跟踪控制研究
基于深度强化学习和倾摆技术的汽车路径跟踪控制研究
收藏 引用
作者: 葛振 南京林业大学
学位级别:硕士
当无人驾驶车辆以较高的速度进行路径跟踪控制时,车体非常容易侧倾过度而导致失去稳定性甚至侧翻,这是研究无人驾驶车辆路径跟踪技术需要考虑的一个问题。本文将倾摆控制应用到路径跟踪中,通过控制车身向弯道内侧倾斜,从而降低车辆横向... 详细信息
来源: 同方学位论文库 同方学位论文库 评论