咨询与建议

限定检索结果

文献类型

  • 6 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 10 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 6 篇 工学
    • 2 篇 仪器科学与技术
    • 2 篇 计算机科学与技术...
    • 1 篇 机械工程
    • 1 篇 材料科学与工程(可...
    • 1 篇 控制科学与工程
    • 1 篇 水利工程
  • 2 篇 理学
    • 2 篇 数学
  • 1 篇 教育学
    • 1 篇 心理学(可授教育学...
  • 1 篇 军事学
    • 1 篇 军制学

主题

  • 10 篇 mdp模型
  • 2 篇 折扣
  • 2 篇 矩最优模型
  • 1 篇 纯粹接触效应
  • 1 篇 kalman运动估计
  • 1 篇 启动效应
  • 1 篇 adaboost算法
  • 1 篇 多目标点迹-航迹关...
  • 1 篇 动态维护策略
  • 1 篇 离散时间
  • 1 篇 自动化集装箱码头
  • 1 篇 维护与加工联合抉...
  • 1 篇 策略函数
  • 1 篇 双场桥协同调度
  • 1 篇 卷积神经网络
  • 1 篇 覆盖分析
  • 1 篇 深度强化学习算法
  • 1 篇 los算法
  • 1 篇 决策
  • 1 篇 强化学习

机构

  • 2 篇 清华大学
  • 1 篇 东南大学
  • 1 篇 南京大学
  • 1 篇 华东师范大学
  • 1 篇 广东工业大学
  • 1 篇 吉林开放大学
  • 1 篇 大连理工大学
  • 1 篇 南京电子技术研究...
  • 1 篇 上海大学

作者

  • 2 篇 林元烈
  • 1 篇 王翠芬
  • 1 篇 林建星
  • 1 篇 沈小丰
  • 1 篇 史双飞
  • 1 篇 于泳红
  • 1 篇 丁国胜
  • 1 篇 高雪峰
  • 1 篇 于雷
  • 1 篇 蔡民杰
  • 1 篇 唐丹丹
  • 1 篇 张震

语言

  • 10 篇 中文
检索条件"主题词=MDP模型"
10 条 记 录,以下是1-10 订阅
排序:
深度学习技术在航迹控制系统中的应用
收藏 引用
舰船科学技术 2024年 第10期46卷 174-177页
作者: 于雷 吉林开放大学 吉林长春130022
研究深度学习技术在航迹控制系统中的应用,实现航迹智能、精确控制,以适应复杂多变环境和任务需求。利用LOS算法确定船舶航行期望航向角、航迹误差,在融合船舶模型采集的船舶状态信息后,得到航迹跟踪控制的状态变量,将其输入到基于mdp... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
离散时间mdp矩最优模型——折扣依赖于历史的情形
收藏 引用
应用概率统计 1992年 第1期8卷 27-34页
作者: 林元烈 林建星 清华大学 北京100084
本文在S、A(i)(i∈S)均匀可列集情形下,建立了折扣依赖于历史的矩最优模型。给出了折扣总报酬k阶矩在各类策略下的统一表达式;讨论了矩最优策略的结构与性质;证明了矩最优方程在给定条件下,存在唯一的有界解。
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于mdp模型的软件测试技术研究
基于MDP模型的软件测试技术研究
收藏 引用
作者: 沈小丰 东南大学
学位级别:硕士
IEEE将软件测试定义为:使用人工或自动手段来运行或测定某个系统的过程,其目的在于检验它是否满足规定的需求或是弄清预期结果与实际结果之间的差别。作为保证软件质量最为有效的测试技术,已经越来越引起软件用户及开发人员的关注。据统... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于强化学习的多目标点航关联方法
收藏 引用
指挥控制与仿真 2022年 第2期44卷 43-48页
作者: 丁国胜 蔡民杰 南京电子技术研究所 江苏南京210039
针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning,RL)方法为基础,提出了一种基于Q学习的多目标点迹-航迹关联方法。首先,根据整个过程中目标的运动状态,建立马尔可夫决策过程(Markov Decision Process,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
决策的内隐认知机制研究现状
收藏 引用
心理科学 2003年 第6期26卷 1095-1098页
作者: 于泳红 华东师范大学心理系 上海200062
决策是和人类生活密切相关的一项活动.人们在日常生活中每天都要都要做出各种各样的决策.如决定购买哪一品牌的商品,选择什么样的住宅,乃至升学就业都离不开决策行为.
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
连续时间折扣矩最优模型及其与离散时间拟折扣矩最优模型的关系——Q 矩阵族未必保守的情形
收藏 引用
数学学报(中文版) 1992年 第1期35卷 8-19页
作者: 林元烈 清华大学应用数学系 北京100084
本文是首次在转移率矩阵族为一般 Q 矩阵族(未必保守亦未必一致有界)的条件下,研究状态空间与决策集均为可数集的连续时间折扣矩最优模型(M_k-CTmdp);提出离散时间折扣依赖于状态与决策的拟折扣矩最优模型(β_k-GTmdp);并揭示二者之间... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于会话搜索的网页排序算法的研究与设计
基于会话搜索的网页排序算法的研究与设计
收藏 引用
作者: 唐丹丹 南京大学
学位级别:硕士
随着互联网技术的迅速发展,互联网上的资源数量越来越多。搜索引擎的发展使得用户可以在庞大的信息资源中找到自己所需要的信息。用户可以在搜索引擎上得到自己感兴趣的信息,影响用户信息检索满意度的就是搜索引擎返回给用户的网页信息... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于深度强化学习的自动化集装箱码头双场桥动态调度研究
基于深度强化学习的自动化集装箱码头双场桥动态调度研究
收藏 引用
作者: 高雪峰 大连理工大学
学位级别:硕士
世界经济一体化加速了各国之前的贸易往来,港口作为多式联运中海陆联运的重要枢纽,也在推动区域发展过程中承担起更为重要的角色。近些年来,随着港口集装箱吞吐量的激增以及船舶的大型化趋势,对码头的技术水平和运营能力提出了新的要求... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
半导体生产线动态维护策略研究
半导体生产线动态维护策略研究
收藏 引用
作者: 王翠芬 广东工业大学
学位级别:硕士
半导体生产线结构复杂,具有典型的重入特点,加工产品种类多样,设备集成度高、造价昂贵。近年来半导体制造行业发展迅速,竞争激烈。合理的维护策略能够最大化设备价值,带来较高收益,提升企业市场竞争力。本文建立了设备生产和维护系统的... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于决策的人脸检测与自动跟踪方法
收藏 引用
计算机技术与发展 2019年 第9期29卷 35-39页
作者: 史双飞 张震 上海大学机电工程与自动化学院
对人脸检测与跟踪的研究现状进行了简要介绍,发现传统的mdp(Markov decision processes)跟踪算法需要手动初始化,这不利于实际场景中的灵活运用。因此,提出一种基于Viola-Jones人脸检测算法和改进的mdp自动跟踪算法。从视频序列中提取... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论