咨询与建议

限定检索结果

文献类型

  • 10 篇 学位论文
  • 9 篇 期刊文献

馆藏范围

  • 19 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 18 篇 工学
    • 9 篇 控制科学与工程
    • 2 篇 机械工程
    • 2 篇 仪器科学与技术
    • 2 篇 电气工程
    • 2 篇 电子科学与技术(可...
    • 2 篇 计算机科学与技术...
    • 2 篇 网络空间安全
    • 1 篇 信息与通信工程
    • 1 篇 核科学与技术
    • 1 篇 公安技术
  • 2 篇 经济学
    • 2 篇 应用经济学

主题

  • 19 篇 深度双q网络
  • 8 篇 深度强化学习
  • 3 篇 强化学习
  • 2 篇 功率分配
  • 2 篇 竞争网络
  • 2 篇 供应链
  • 2 篇 软件定义网络
  • 2 篇 深度确定性策略梯...
  • 2 篇 生鲜农产品
  • 2 篇 深度学习
  • 1 篇 老鼠流
  • 1 篇 竞争网络结构
  • 1 篇 对比预测编码
  • 1 篇 传统潮流计算
  • 1 篇 sdn安全
  • 1 篇 调制方式
  • 1 篇 离线模型
  • 1 篇 路径规划
  • 1 篇 媒体访问控制协议
  • 1 篇 蜂窝网络

机构

  • 2 篇 浙江理工大学
  • 1 篇 国网浙江省电力有...
  • 1 篇 吉林大学
  • 1 篇 华南理工大学
  • 1 篇 云南民族大学
  • 1 篇 广东交通职业技术...
  • 1 篇 哈尔滨工程大学
  • 1 篇 辽宁工程技术大学
  • 1 篇 众格智能科技有限...
  • 1 篇 河南科技大学
  • 1 篇 华北电力大学
  • 1 篇 天津大学
  • 1 篇 沈阳理工大学
  • 1 篇 北京邮电大学
  • 1 篇 北京九章云极科技...
  • 1 篇 西安电子科技大学
  • 1 篇 上海海事大学
  • 1 篇 河北工业大学
  • 1 篇 中原工学院
  • 1 篇 中国电力科学研究...

作者

  • 2 篇 李姣姣
  • 1 篇 孙力帆
  • 1 篇 张岩
  • 1 篇 杨昕
  • 1 篇 王申
  • 1 篇 唐嘉宁
  • 1 篇 安城安
  • 1 篇 邓俊
  • 1 篇 郭新
  • 1 篇 宋佰霖
  • 1 篇 王伟
  • 1 篇 何利力
  • 1 篇 章姝俊
  • 1 篇 黄思萌
  • 1 篇 普杰信
  • 1 篇 许华
  • 1 篇 魏忠达
  • 1 篇 耿烜
  • 1 篇 杨华
  • 1 篇 殷爽爽

语言

  • 19 篇 中文
检索条件"主题词=深度双Q网络"
19 条 记 录,以下是1-10 订阅
排序:
融合对比预测编码的深度双q网络
收藏 引用
计算机工程与应用 2023年 第6期59卷 162-170页
作者: 刘剑锋 普杰信 孙力帆 河南科技大学信息工程学院 河南洛阳471023
在模型未知的部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)下,智能体无法直接获取环境的真实状态,感知的不确定性为学习最优策略带来挑战。为此,提出一种融合对比预测编码表示的深度双q网络强化学... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度双q网络的电网关键节点辨识研究
基于深度双Q网络的电网关键节点辨识研究
收藏 引用
作者: 张岩 华北电力大学(北京)
学位级别:硕士
电力已经是数字化、智能化时代最基本最重要的能源供应形式,城市电网如何安全稳定运行是电力公司最为重视的问题之一。短路、设备损坏、过载等等因素导致停电灾难会对社会经济,甚至人身安全造成威胁。并入新能源等发电方式不仅使电网节... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
融合动作剔除的深度竞争q网络智能干扰决策算法
收藏 引用
空军工程大学学报(自然科学版) 2021年 第4期22卷 92-98页
作者: 饶宁 许华 宋佰霖 空军工程大学信息与导航学院 西安710077
为解决战场通信干扰决策问题,设计了一种融合动作剔除的深度竞争q网络智能干扰决策方法。该方法在深度双q网络框架基础上采用竞争结构的神经网络决策最优干扰动作,并结合优势函数判断各干扰动作的相对优劣,在此基础上引入无效干扰动... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度双q网络的多用户蜂窝网络功率分配算法研究
收藏 引用
计算机应用研究 2021年 第5期38卷 1498-1502页
作者: 王伟 殷爽爽 辽宁工程技术大学基础教学部 辽宁葫芦岛125105 辽宁工程技术大学电子与信息工程学院 辽宁葫芦岛125105
针对现有蜂窝网络功率分配算法存在泛化能力弱、效率低等问题进行了研究,提出基于深度双q网络(deep double q network,DDqN)的功率分配算法。采用神经网络结构,解决强化学习过程中易出现的维度灾难及值函数过估计问题;对状态信息进行... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于权重值的竞争深度双q网络算法
收藏 引用
南京信息工程大学学报(自然科学版) 2021年 第5期13卷 564-570页
作者: 汪晨曦 赵学艳 郭新 华南理工大学自动化科学与工程学院 广州510641 广东交通职业技术学院 机电工程学院广州510650
深度强化学习中,深度q网络算法存在严重高估动作值问题,使得智能体的表现不尽人意.尽管深度双q网络和竞争网络结构可以部分缓解高估带来的影响,但引入q网络的同时,有时也会低估动作值.本文提出了一种基于权重值的竞争深度双q网络算... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种采用Dueling⁃DDqN算法的无线网络MAC协议
收藏 引用
北京邮电大学学报 2023年 第3期46卷 25-30,55页
作者: 杨华 耿烜 孔宁 上海海事大学信息工程学院 上海201306 众格智能科技有限公司 上海201100
为了在快速变化的无线通信网络中实现系统吞吐量最大化,提出了一种采用竞争架构深度双q网络(dueling⁃DDqN)算法的媒体访问控制协议。该协议将竞争架构q网络算法中的q值运算方法应用于深度双q网络中的q值计算,结合了竞争架构q网络深度... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于离线模型预训练学习的改进DDPG算法
收藏 引用
计算机工程与设计 2022年 第5期43卷 1451-1458页
作者: 张茜 王洪格 倪亮 中原工学院计算机学院 河南郑州450007
针对DDPG(deep deterministic policy gradient)在线训练过程中陷入局部极小值及产生大量试错动作和无效数据的问题,提出一种基于离线模型预训练学习的改进DDPG算法。利用已有数据离线训练对象状态模型和价值奖励模型,提前对DDPG中动作... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度强化学习的生鲜农产品库存控制模型
基于深度强化学习的生鲜农产品库存控制模型
收藏 引用
作者: 李姣姣 浙江理工大学
学位级别:硕士
生鲜农产品指未经加工或经少量加工的初级农产品,包括果蔬、肉类以及水产品等,是日常生活中的必需品。生鲜农产品供应链是一个复杂系统,包括生产、采购、物流和库存等多个环节。其中,库存衔接供给与需求,库存管理不当将导致供应链的上... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
面向D2D-NOMA通信的资源分配机制研究
面向D2D-NOMA通信的资源分配机制研究
收藏 引用
作者: 肖琳 吉林大学
学位级别:硕士
无线通信技术的飞速发展,以及各类新型通信业务场景的不断涌现,正在促使着人-机-物-空间的全面互联。伴随着网络终端数目的持续增长,无线频谱资源稀缺与频谱利用率之间的矛盾日益显现,加重了整个网络的负担。终端直连通信(Device-to-De... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
反应堆智能自动启堆及监测技术研究
反应堆智能自动启堆及监测技术研究
收藏 引用
作者: 胡冀锋 哈尔滨工程大学
学位级别:硕士
目前反应堆的启堆过程主要由操纵人员手动完成,与满功率运行相比,启堆过程涉及系统众多,步骤复杂且耗时很长,因此容易产生人因事故,进而威胁反应堆的安全。此外,堆芯功率分布在启堆阶段会发生剧烈变化,需要持续监测该过程的堆芯功率分... 详细信息
来源: 同方学位论文库 同方学位论文库 评论