咨询与建议

限定检索结果

文献类型

  • 7 篇 期刊文献
  • 7 篇 学位论文

馆藏范围

  • 14 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 14 篇 工学
    • 14 篇 计算机科学与技术...
    • 14 篇 软件工程
    • 13 篇 控制科学与工程
    • 2 篇 机械工程
    • 1 篇 仪器科学与技术
    • 1 篇 化学工程与技术
    • 1 篇 轻工技术与工程
    • 1 篇 生物工程
  • 13 篇 管理学
    • 13 篇 管理科学与工程(可...

主题

  • 14 篇 基于模型的强化学...
  • 6 篇 强化学习
  • 3 篇 多智能体系统
  • 2 篇 高斯回归
  • 2 篇 样本效率
  • 1 篇 推荐系统
  • 1 篇 无模型强化学习
  • 1 篇 离轨策略
  • 1 篇 编码器
  • 1 篇 时间差分误差
  • 1 篇 注意力机制
  • 1 篇 优化控制
  • 1 篇 深度确定性策略算...
  • 1 篇 深度强化学习
  • 1 篇 人工智能
  • 1 篇 元学习
  • 1 篇 维数灾难
  • 1 篇 优先经验重放
  • 1 篇 生成对抗网络
  • 1 篇 规划算法

机构

  • 3 篇 中南大学
  • 2 篇 北京交通大学
  • 1 篇 河北大学
  • 1 篇 中国科学院大学
  • 1 篇 山东省工业控制技...
  • 1 篇 西安交通大学
  • 1 篇 中国科学院自动化...
  • 1 篇 江苏国信协联能源...
  • 1 篇 安徽大学
  • 1 篇 北京邮电大学
  • 1 篇 青岛大学
  • 1 篇 先进控制与智能自...
  • 1 篇 上海交通大学
  • 1 篇 中国矿业大学
  • 1 篇 江南大学
  • 1 篇 南京邮电大学
  • 1 篇 中国科学院脑科学...

作者

  • 2 篇 魏海军
  • 1 篇 兰旭光
  • 1 篇 姚昌瑀
  • 1 篇 邱天
  • 1 篇 王迪
  • 1 篇 张俊格
  • 1 篇 孙世光
  • 1 篇 曹卫华
  • 1 篇 祝丽娜
  • 1 篇 尹奇跃
  • 1 篇 苗茂栋
  • 1 篇 黄文振
  • 1 篇 任坤
  • 1 篇 袁姣红
  • 1 篇 石贵阳
  • 1 篇 李大鹏
  • 1 篇 郑南宁
  • 1 篇 李耀辉
  • 1 篇 张晓明
  • 1 篇 沈硕

语言

  • 14 篇 中文
检索条件"主题词=基于模型的强化学习"
14 条 记 录,以下是1-10 订阅
基于模型的强化学习中可学习的样本加权机制
收藏 引用
软件学报 2023年 第6期34卷 2765-2775页
作者: 黄文振 尹奇跃 张俊格 黄凯奇 中国科学院大学人工智能学院 北京100049 中国科学院自动化研究所智能系统与工程研究中心 北京100190 中国科学院脑科学与智能技术卓越创新中心 上海200031
基于模型的强化学习方法利用已收集的样本对环境进行建模并使用构建的环境模型生成虚拟样本以辅助训练,因而有望提高样本效率.但由于训练样本不足等问题,构建的环境模型往往是不精确的,其生成的样本也会因携带的预测误差而对训练过程产... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于模型的机器人强化学习研究综述
收藏 引用
模式识别与人工智能 2022年 第1期35卷 1-16页
作者: 孙世光 兰旭光 张翰博 郑南宁 西安交通大学人工智能与机器人研究所 西安710049
基于模型的强化学习通过学习一个环境模型基于模型的策略优化或规划,实现机器人更接近于人类的学习和交互方式.文中简述机器人学习问题的定义,介绍机器人学习基于模型的强化学习方法,包括主流的模型学习模型利用的方法.主流的... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于模型可信度的强化学习方法
收藏 引用
控制工程 2024年
作者: 王迪 张震 王洋 任坤 青岛大学自动化学 山东省工业控制技术重点实验室
针对无模型强化学习样本效率低下和基于模型的强化学习存在模型偏差的问题,文中提出了一种基于模型可信度的强化学习方法MBMC。该算法采用Dyna框架,同时利用无模型方法和基于模型的方法进行更新,有效的提升了样本的利用效率,并提出... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于目标导向模型强化学习算法研究
基于目标导向模型的强化学习算法研究
收藏 引用
作者: 邱天 北京交通大学
学位级别:硕士
序列决策问题的求解能力是人工智能的核心要素之一,强化学习是一种序列决策问题的求解方法。无模型强化学习算法在诸多应用中获得了显著的成果,但需要与环境进行大量交互以获取足够的数据进行策略的训练。而基于模型的强化学习算法通... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于模型的动态分层强化学习算法研究
基于模型的动态分层强化学习算法研究
收藏 引用
作者: 袁姣红 中南大学
学位级别:硕士
强化学习因具有自学习和在线学习的良好特性,已经成为机器学习领域的一个重要分支。然而,智能体在大规模高维度的决策环境下进行强化学习时被“维数灾难”(学习参数的个数随变量的维数成指数级增长)所困扰,学习效率低下,导致难以及时... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
柠檬酸三钙中和过程的强化学习优化控制
收藏 引用
化工学报 2025年
作者: 祝丽娜 苗茂栋 金赛 赵忠盖 孙福新 石贵阳 刘飞 江南大学轻工过程先进控制教育部重点实验室 江苏国信协联能源有限公司 江南大学粮食发酵工艺与技术国家工程研究中心
三钙中和过程是柠檬酸提取工艺的重要工序,是影响柠檬酸成品质量、产品收率的关键工段。该过程具有时滞、无参考轨迹、初始物料变化大、反应不可逆等特点,传统控制算法很难对其进行优化控制。针对上述问题,用强化学习算法深度确定性... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
感知环境模型不确定性的强化学习算法
感知环境模型不确定性的强化学习算法
收藏 引用
作者: 沈硕 北京交通大学
学位级别:硕士
强化学习算法在近年来获得了许多进步与成功,然而目前强化学习算法的发展与应用主要局限在电子游戏、棋牌等虚拟领域。强化学习算法在真实世界中的应用始终受限于高昂的采样成本,决策的不稳定等缺点。基于模型的强化学习算法(Model-base... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于强化学习的教育资讯个性化推荐系统研究与实现
基于强化学习的教育资讯个性化推荐系统研究与实现
收藏 引用
作者: 黄莹 北京邮电大学
学位级别:硕士
互联网技术的发展使得网络信息资源日益庞大。对于用户而言,海量的数据信息严重干扰其对信息的正确选择,因此信息利用率非常低。对于企业而言,满足用户个性化需求对其扩大用户规模具有不可替代的作用。推荐系统可有效解决信息过载问题,... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于隐空间建模的强化学习研究
基于隐空间建模的强化学习研究
收藏 引用
作者: 刘运新 中国矿业大学
学位级别:硕士
基于模型的强化学习算法,能利用已知的环境模型或者学习到的环境模型提高策略网络的学习效率,从而提高样本数据的利用效率。同时,基于模型的强化学习算法还能利用模型进行策略规划,从而进行精确决策和前瞻性决策。基于模型的强化学习算... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于高斯回归的连续空间多智能体强化学习算法研究
基于高斯回归的连续空间多智能体强化学习算法研究
收藏 引用
作者: 魏海军 中南大学
学位级别:硕士
摘要:本文以多智能体系统为研究对象,研究应用强化学习智能获取多智能体系统的行为策略,其中关键问题主要包括空间泛化与学习降维两个方面。最初,强化学习理论及其相关定义是以离散环境为基础展开讨论的,而实际应用环境的内在连续性大... 详细信息
来源: 同方学位论文库 同方学位论文库 评论