咨询与建议

限定检索结果

文献类型

  • 183 篇 期刊文献
  • 115 篇 学位论文
  • 4 篇 会议

馆藏范围

  • 302 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 294 篇 工学
    • 155 篇 计算机科学与技术...
    • 148 篇 软件工程
    • 137 篇 控制科学与工程
    • 65 篇 仪器科学与技术
    • 61 篇 机械工程
    • 42 篇 信息与通信工程
    • 39 篇 电子科学与技术(可...
    • 24 篇 电气工程
    • 22 篇 交通运输工程
    • 17 篇 航空宇航科学与技...
    • 11 篇 船舶与海洋工程
    • 10 篇 兵器科学与技术
    • 9 篇 网络空间安全
    • 6 篇 动力工程及工程热...
    • 6 篇 公安技术
    • 3 篇 光学工程
    • 3 篇 矿业工程
    • 2 篇 建筑学
    • 2 篇 土木工程
  • 132 篇 管理学
    • 131 篇 管理科学与工程(可...
    • 2 篇 工商管理
  • 14 篇 军事学
    • 7 篇 战术学
    • 7 篇 军队指挥学
    • 6 篇 军事装备学
  • 9 篇 理学
    • 4 篇 数学
    • 2 篇 物理学
    • 2 篇 系统科学
    • 1 篇 统计学(可授理学、...
  • 4 篇 艺术学
    • 4 篇 设计学(可授艺术学...
  • 3 篇 经济学
    • 3 篇 应用经济学
  • 3 篇 医学
  • 1 篇 农学

主题

  • 302 篇 深度q网络
  • 97 篇 深度强化学习
  • 72 篇 强化学习
  • 38 篇 路径规划
  • 13 篇 深度学习
  • 10 篇 深度确定性策略梯...
  • 9 篇 无人机
  • 9 篇 资源分配
  • 8 篇 边缘计算
  • 8 篇 卷积神经网络
  • 7 篇 智能决策
  • 7 篇 交通信号控制
  • 7 篇 移动边缘计算
  • 7 篇 任务卸载
  • 7 篇 故障诊断
  • 7 篇 经验回放
  • 6 篇 优先经验回放
  • 6 篇 q学习
  • 6 篇 马尔科夫决策过程
  • 6 篇 神经网络

机构

  • 11 篇 南京航空航天大学
  • 10 篇 电子科技大学
  • 7 篇 东南大学
  • 7 篇 西南交通大学
  • 7 篇 哈尔滨工业大学
  • 7 篇 苏州大学
  • 7 篇 华南理工大学
  • 6 篇 北京交通大学
  • 6 篇 西安电子科技大学
  • 6 篇 南京邮电大学
  • 5 篇 武汉理工大学
  • 5 篇 北京邮电大学
  • 5 篇 青岛理工大学
  • 5 篇 重庆大学
  • 5 篇 吉林大学
  • 4 篇 华中科技大学
  • 4 篇 国防科技大学
  • 4 篇 南京信息工程大学
  • 4 篇 河南理工大学
  • 4 篇 西北工业大学

作者

  • 4 篇 刘全
  • 3 篇 冯利
  • 3 篇 夏宗涛
  • 2 篇 韩燮
  • 2 篇 赵海涛
  • 2 篇 周双林
  • 2 篇 王锦
  • 2 篇 秦进
  • 2 篇 吴文
  • 2 篇 张雪英
  • 2 篇 赵家琛
  • 2 篇 唐慕尧
  • 2 篇 王玺
  • 2 篇 杨玉莹
  • 2 篇 闫岩
  • 2 篇 谢俊伟
  • 2 篇 陈跃
  • 2 篇 毕敬
  • 2 篇 张劲东
  • 2 篇 陈晨

语言

  • 302 篇 中文
检索条件"主题词=深度Q网络"
302 条 记 录,以下是1-10 订阅
排序:
深度q网络在月球着陆任务中的性能评估与改进
收藏 引用
西北工业大学学报 2024年 第3期42卷 396-405页
作者: 岳颀 石伊凡 褚晶 黄勇 西安邮电大学自动化学院 陕西西安710121 西北工业大学航天学院 陕西西安710072
基于深度q网络(DqN)技术的强化学习方法得到越来越广泛的应用,但该类算法的性能深受多因素影响。文中以月球登陆器为例,探讨不同超参数对DqN性能的影响,在此基础上训练得到性能较优的模型。目前已知DqN模型在100个测试回合下平均奖励为2... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度q网络的多起点多终点AGV路径规划
收藏 引用
计算机集成制造系统 2023年 第8期29卷 2550-2562页
作者: 黄岩松 姚锡凡 景轩 胡晓阳 华南理工大学机械与汽车工程学院 广东广州510640
自动引导小车(AGV)在工厂中承担不同节点之间的物料运输工作,在考虑全局路径最优的情况下需要对AGV进行多起点多终点的路径规划。针对现有深度强化学习算法研究多考虑单起点达到单终点的路径规划情况,涉及多起点多终点的情况时泛化性能... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度q网络的无人车侦察路径规划
收藏 引用
系统工程与电子技术 2024年 第9期46卷 3070-3081页
作者: 夏雨奇 黄炎焱 陈恰 南京理工大学自动化学院 江苏南京210094
在城市战场环境下,无人侦察车有助于指挥部更好地了解目标地区情况,提升决策准确性,降低军事行动的威胁。目前,无人侦察车多采用阿克曼转向结构,传统算法规划的路径不符合无人侦察车的运动学模型。对此,将自行车运动模型和深度q网络相结... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 博看期刊 评论
计及稳压率和经济性的城轨直流牵引供电光储系统深度q网络优化控制方法
收藏 引用
电力自动化设备 2024年 第10期44卷 46-52页
作者: 吕宗璞 戴朝华 姚志刚 周斌彬 郭爱 吴磊 西南交通大学电气工程学院 四川成都610031 中国铁道科学研究院集团有限公司 北京100080
光伏应用于直流牵引供电系统可提高新能源渗透率、降低系统能耗,但可再生能源出力的不确定性及列车负荷的强波动性增加了控制策略的寻优难度。针对该问题,提出一种基于深度强化学习的控制策略优化方法。该方法基于深度q网络,将源-储-荷... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于多组并行深度q网络的连续空间追逃博弈算法
收藏 引用
兵工学报 2021年 第3期42卷 663-672页
作者: 刘冰雁 叶雄兵 岳智宏 董献洲 张其扬 军事科学院 北京100091 32032部队 北京100094
为解决连续空间追逃博弈(PEG)问题,提出一种基于多组并行深度q网络(DqN)的连续空间PEG算法。应对连续行为空间中为避免传统强化学习存在的维数灾难不足,通过构建Takagi-Sugeno-Kang模糊推理模型来表征连续空间;为应对离散动作集自学习... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度q网络的在线服务功能链部署方法
收藏 引用
电子与信息学报 2021年 第11期43卷 3122-3130页
作者: 邱航 汤红波 游伟 中国人民解放军战略支援部队信息工程大学 郑州450002
针对5G网络资源状态动态变化和网络模型高维度下服务功能链部署的复杂性问题,该文提出一种基于深度q网络的在线服务功能链部署方法(DeePSCD)。首先,为描述网络资源动态变化的特征,将服务功能链部署建模成马尔可夫决策过程,然后,针对系... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度q网络学习的机器人端到端控制方法
收藏 引用
仪器仪表学报 2018年 第10期39卷 36-43页
作者: 张浩杰 苏治宝 苏波 中国北方车辆研究所
为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度q网络学习的机器人端到端控制方法。首先,利用传统q学习方法进行强化学习,生成大量的有标签数据样... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种最大置信上界经验采样的深度q网络方法
收藏 引用
计算机研究与发展 2018年 第8期55卷 1694-1705页
作者: 朱斐 吴文 刘全 伏玉琛 苏州大学计算机科学与技术学院 江苏苏州215006 江苏省计算机信息处理技术重点实验室(苏州大学) 江苏苏州215006 符号计算与知识工程教育部重点实验室(吉林大学) 长春130012 常熟理工学院计算机科学与工程学院 江苏常熟215500
深度学习(deep learning,DL)和强化学习(reinforcement learning,RL)结合形成的深度强化学习(deep reinforcement learning,DRL)是目前人工智能领域的一个热点.深度强化学习在处理具有高维度输入的最优策略求解任务中取得了很大的突破... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
面向物联网的深度q网络无人机路径规划
收藏 引用
电子与信息学报 2022年 第11期44卷 3850-3857页
作者: 张建行 康凯 钱骅 杨淼 中国科学院上海高等研究院 上海201210 中国科学院大学 北京100049 上海科技大学信息科学与技术学院 上海201210
随着无人机技术的广泛应用,基于无人机辅助数据收集的物联网架构扩展了物联网的应用范围,尤其适用于军事战场、灾害救援等极端场景。针对上述场景,该文提出一种基于深度q网络(Deep q-Network,DqN)框架的无人机飞行路径规划算法。该算法... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度q网络的平面域Delaunay网格优化算法
收藏 引用
计算机辅助设计与图形学学报 2022年 第12期34卷 1943-1950页
作者: 张浩杰 刘星 李鸿晶 南京工业大学工程力学研究所 南京211816
网格优化是Delaunay网格生成后的必要步骤,对于保证数值模拟的可靠性至关重要.为了改善平面域Delaunay网格的质量,提出一种基于深度q网络(deep q network,DqN)的网格优化算法.首先,对初始网格进行质量评估,选出不满足要求的单元结点,并... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论