咨询与建议

限定检索结果

文献类型

  • 7 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 6 篇 工学
    • 5 篇 计算机科学与技术...
    • 5 篇 软件工程
    • 3 篇 控制科学与工程
    • 1 篇 机械工程
    • 1 篇 仪器科学与技术
    • 1 篇 信息与通信工程
  • 3 篇 管理学
    • 3 篇 管理科学与工程(可...
  • 1 篇 经济学
    • 1 篇 应用经济学
  • 1 篇 理学
    • 1 篇 数学

主题

  • 8 篇 外推误差
  • 3 篇 强化学习
  • 3 篇 离线强化学习
  • 2 篇 q学习
  • 2 篇 双足机器人
  • 1 篇 目标状态
  • 1 篇 推荐系统
  • 1 篇 火力
  • 1 篇 机器人控制
  • 1 篇 智能艾灸
  • 1 篇 矩形网格
  • 1 篇 目标航迹
  • 1 篇 模仿学习
  • 1 篇 c~3i
  • 1 篇 目标机动
  • 1 篇 航迹滤波
  • 1 篇 有限差分
  • 1 篇 作战单位
  • 1 篇 变分推断
  • 1 篇 ood

机构

  • 2 篇 山东省工业控制技...
  • 2 篇 青岛大学
  • 1 篇 重庆交通大学
  • 1 篇 中国科学院
  • 1 篇 天津大学
  • 1 篇 华东工学院
  • 1 篇 山东潍坊烟草有限...
  • 1 篇 重庆大学
  • 1 篇 汕头大学
  • 1 篇 广东工业大学
  • 1 篇 天津大学胸科医院
  • 1 篇 湘潭大学
  • 1 篇 青岛地铁集团有限...

作者

  • 1 篇 陈毛
  • 1 篇 宋天锁
  • 1 篇 朱起定
  • 1 篇 张斯力
  • 1 篇 王迪
  • 1 篇 蔡瑞初
  • 1 篇 任坤
  • 1 篇 陈锶奇
  • 1 篇 王仕超
  • 1 篇 李梓健
  • 1 篇 周维庆
  • 1 篇 马骥桥
  • 1 篇 汪云飞
  • 1 篇 谢立华
  • 1 篇 郝志峰
  • 1 篇 王洋
  • 1 篇 赵德京
  • 1 篇 王加存
  • 1 篇 赵佳宁
  • 1 篇 许志刚

语言

  • 8 篇 中文
检索条件"主题词=外推误差"
8 条 记 录,以下是1-10 订阅
排序:
基于因果机制约束的强化荐系统
收藏 引用
计算机工程 2024年 第5期50卷 279-290页
作者: 张斯力 李梓健 蔡瑞初 郝志峰 闫玉光 广东工业大学计算机学院 广东广州510006 汕头大学工学院 广东汕头515063
利用历史数据训练强化学习荐系统已经得到越来越多研究人员的关注,但是历史数据使得强化学习模型对状态-动作估值错误,产生数据偏差,如流行度偏差和选择偏差。造成上述问题的原因是历史数据分布与强化学习策略采集的数据分布不一致以... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于悲观扩散策略Q学习的机器人控制方法
收藏 引用
电光与控制 2024年
作者: 王洋 张震 宋婷婷 任坤 王迪 青岛大学自动化学院 山东省工业控制技术重点实验室 青岛地铁集团有限公司运营分公司
针对离线多智能体强化学习中,智能体数量的增加显著加剧外推误差的累积,导致该误差呈现指数级增长的问题,文中提出了一种名为悲观扩散策略Q学习(Pessimistic Diffusion Policy Q-Learning, PDPQL)的离线多智能体强化学习算法。PDPQ... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于离线强化学习的研究综述
收藏 引用
无线电通信技术 2024年 第5期50卷 831-842页
作者: 陈锶奇 耿婕 汪云飞 余伟驰 赵佳宁 王仕超 重庆交通大学信息科学与工程学院 重庆400074 天津大学胸科医院 天津300072 天津大学智能与计算学部 天津300072
离线强化学习作为一种新兴范式,凭借其无需与环境交互即可利用大量离线数据进行策略学习的特性,展现出了很高的应用潜力和价值,特别是在医疗、自动驾驶等高风险领域中具有显著优势。从离线强化学习的基本概念、核心问题、主要方法依次展... 详细信息
来源: 维普期刊数据库 维普期刊数据库 博看期刊 同方期刊数据库 同方期刊数据库 评论
离线逆向强化学习研究与应用
离线逆向强化学习研究与应用
收藏 引用
作者: 陈毛 重庆大学
学位级别:硕士
逆向强化学习能够从专家的演示轨迹中重新构建出奖励函数,这解决了强化学习任务中奖励函数难以设计的问题。传统的逆向强化学习需要和环境交互进行训练,然而,在本文考虑的智能艾灸应用中,让机械手臂代替艾灸专家进行艾灸移动决策时,由... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
一种野战防空C~3I系统数学模型的初步探讨
收藏 引用
火力与指挥控制 1988年 第4期 22-32页
作者: 马骥桥 宋天锁
本模型包括,根据目标运动状态方程,用等概率椭圆检测目标航迹与测量点的相关性,从而建立航迹辨识的相关矩阵,求解这一矩阵,实现多目标航迹辨识;在目标威胁估计和目标穿越火力单位射击空域的时间估值准确的条件下,建立目标火力分配的威... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
有限差分和有限元的单方向
收藏 引用
工程数学学报 1984年 第2期 1-12页
作者: 朱起定 林群 湘潭大学 中国科学院
单方向的思想很容易说明白(参看[8][9]等)。以矩形区域为例,先有一个以(h,k)为步长的矩形网格域Sh ,h,继而分别在单方向进行加密得到了新网格域Sh/2,k和Sh,k/2,然后在这三种网格域上计算偏微分方程的近似解uh ,h,uh/2,k和uh,k/2... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于双重限制Q学习的机器人控制方法
收藏 引用
自动化与仪表 2024年 第3期39卷 61-65页
作者: 周维庆 王飞 赵德京 青岛大学自动化学院 青岛266071 山东省工业控制技术重点实验室 青岛266071 山东潍坊烟草有限公司 潍坊262400
离线强化学习凭借不需要智能体与环境交互即可训练出令人满意效果的优势,在近期得到了非常迅速的发展。为了缓解外推误差和离线强化学习算法过于保守的问题,文中提出了基于双重限制Q学习的离线强化学习算法DIQL,限制Q值网络对数据分布... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
两种实用自适应航迹滤波方法
收藏 引用
火力与指挥控制 1989年 第4期 29-32页
作者: 许志刚 谢立华 王加存 华东工学院
本文在给出检测机动目标的措施之后,介绍了两种实用的自适应航迹滤波方法,即双窗检修法和递估计法。
来源: 同方期刊数据库 同方期刊数据库 评论