咨询与建议

限定检索结果

文献类型

  • 11 篇 期刊文献
  • 2 篇 学位论文

馆藏范围

  • 13 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 13 篇 工学
    • 8 篇 控制科学与工程
    • 3 篇 机械工程
    • 3 篇 计算机科学与技术...
    • 2 篇 石油与天然气工程
    • 2 篇 软件工程
    • 2 篇 公安技术
    • 1 篇 仪器科学与技术
    • 1 篇 交通运输工程
  • 1 篇 理学
    • 1 篇 系统科学
  • 1 篇 军事学
    • 1 篇 军队指挥学

主题

  • 13 篇 sarsa学习
  • 7 篇 强化学习
  • 3 篇 q学习
  • 2 篇 交通灯控制
  • 2 篇 车辆诱导
  • 2 篇 k-均值聚类算法
  • 1 篇 对战仿真
  • 1 篇 抗干扰
  • 1 篇 人工神经网络
  • 1 篇 复杂电磁环境
  • 1 篇 部分可观测markov...
  • 1 篇 优先遍历
  • 1 篇 遗传算法
  • 1 篇 连续状态
  • 1 篇 效用函数
  • 1 篇 状态聚类
  • 1 篇 多层网方法
  • 1 篇 交叉口控制
  • 1 篇 任务分配
  • 1 篇 连续状态表示

机构

  • 3 篇 沈阳理工大学
  • 2 篇 中国科学技术大学
  • 2 篇 北京理工大学
  • 1 篇 国防科技大学
  • 1 篇 重庆邮电大学
  • 1 篇 西安工业大学
  • 1 篇 解放军理工大学
  • 1 篇 中国西南电子技术...
  • 1 篇 江南大学
  • 1 篇 杭州电子科技大学

作者

  • 2 篇 吴沧浦
  • 2 篇 文锋
  • 2 篇 刘永信
  • 2 篇 陈宗海
  • 2 篇 李春贵
  • 2 篇 赵佳文
  • 1 篇 吴晓曙
  • 1 篇 王学宁
  • 1 篇 曹雷
  • 1 篇 贺汉根
  • 1 篇 陈一波
  • 1 篇 白静静
  • 1 篇 吴静
  • 1 篇 刘国栋
  • 1 篇 徐志雄
  • 1 篇 陈希亮
  • 1 篇 徐昕
  • 1 篇 任安虎
  • 1 篇 赵知劲
  • 1 篇 李珊

语言

  • 13 篇 中文
检索条件"主题词=Sarsa学习"
13 条 记 录,以下是1-10 订阅
排序:
基于sarsa学习的跳频系统智能抗干扰决策算法
收藏 引用
现代电子技术 2023年 第1期46卷 31-35页
作者: 陈一波 赵知劲 杭州电子科技大学通信工程学院 浙江杭州310018
为了提高在干扰多变电磁环境下跳频通信系统的抗干扰性能,提出一种基于改进sarsa学习的智能抗干扰决策算法。试错是强化学习最重要的特征,它可以影响算法的长期总收益,而试错的优劣由算法探索和利用的表现决定,故文中将基于置信度上界... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于sarsa学习的基站休眠策略研究
收藏 引用
重庆邮电大学学报(自然科学版) 2020年 第4期32卷 536-543页
作者: 杨海 吴静 中国西南电子技术研究所 成都610036 重庆邮电大学通信与信息工程学院 重庆400065
在异构Macro-femto蜂窝网络中,随着日益增长的用户数量使得基站能耗问题变得更加严峻,提升整个移动系统能效的有效方式就是进行基站休眠。根据无模型理论提出一种基于sarsa学习的动态基站休眠算法,算法通过基站学习环境中的用户流量,制... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于模糊神经网络sarsa学习的多机器人任务分配
收藏 引用
计算机应用与软件 2012年 第12期29卷 203-205,222页
作者: 陈夏冰 刘国栋 江南大学物联网工程学院教育部重点实验室 江苏无锡214122
针对动态环境下多机器人任务分配的问题,提出一种基于模糊神经sarsa学习网络的效用函数模型,将模糊推理系统,神经网络模型与sarsa学习算法相结合。设计确定了网络的结构、学习算法以及最终效用值的确定步骤。在仿真实验中,利用该模型能... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于sarsa学习算法的路径诱导算法研究
基于Sarsa学习算法的路径诱导算法研究
收藏 引用
作者: 王星乔 沈阳理工大学
学位级别:硕士
近几十年来,随着我国城市机动化和城镇化的加快,城市遭遇了许多交通问题,如交通拥堵、交通安全、交通污染等。在城市地区,交通拥堵是最为普遍的交通问题,许多学者对解决城市交通拥堵问题作出了努力并提出了多种解决方案。其中,智能交通... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
一种集成规划的sarsa(λ)强化学习算法
收藏 引用
北京理工大学学报 2002年 第3期22卷 325-327页
作者: 李春贵 吴沧浦 刘永信 北京理工大学自动控制系 北京100081
提出一种新的集成规划的 sarsa(λ)强化学习算法 .该算法的主要思想是充分利用已有的经验数据 ,在无模型学习的同时估计系统模型 ,每进行一次无模型学习的试验后 ,利用模型在所记忆的状态 /行动对组成的表中进行规划 ,同时利用该表给出... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于状态聚类的sarsa(λ)强化学习算法
收藏 引用
计算机工程 2003年 第5期29卷 37-38,98页
作者: 李春贵 吴沧浦 刘永信 北京理工大学自动控制系 北京100081
为求解大状态空间的强化学习问题,提出了一种基于状态聚类的sarsa(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行sarsa(λ)学习。若能进行适当的状态聚类,算法... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于sarsa学习的单交叉口配时优化仿真与设计
收藏 引用
国外电子测量技术 2020年 第6期39卷 76-80页
作者: 白静静 任安虎 李珊 西安工业大学电子信息工程学院 西安710021
现如今我国城市道路网络迅速扩大,城市道路交通拥挤状况加剧。传统的定时控制和感应控制不再适应交通环境的多变性、随机性及不确定性。针对Q学习算法只考虑新的状态下获得的最大奖赏,而不考虑新状态带来的风险,将sarsa学习应用于单交... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
连续状态自适应离散化基于K-均值聚类的强化学习方法
收藏 引用
控制与决策 2006年 第2期21卷 143-147页
作者: 文锋 陈宗海 卓睿 周光明 中国科学技术大学自动化系 合肥230027
使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分为两部分:对连续状态空间进行自适应离散化的状态空间学习,使用K-均值聚类算法;寻找最优策略的策略学习,使用替代合适迹sarsa学习算... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
求解部分可观测马氏决策过程的强化学习算法
收藏 引用
控制与决策 2004年 第11期19卷 1263-1266页
作者: 王学宁 贺汉根 徐昕 国防科技大学自动化研究所 湖南长沙410073
针对部分可观测马氏决策过程(POMDP)中,由于感知混淆现象的存在,利用sarsa等算法得到的无记忆策略可能发生振荡的现象,研究了一种基于记忆的强化学习算法——CPnsarsa(λ)学习算法来解决该问题.它通过重新定义状态,Agent结合观测历史来... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于节点生长k-均值聚类算法的强化学习方法
收藏 引用
计算机研究与发展 2006年 第4期43卷 661-666页
作者: 陈宗海 文锋 聂建斌 吴晓曙 中国科学技术大学自动化系 合肥230027
处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论