咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 3 篇 计算机科学与技术...
    • 2 篇 控制科学与工程
    • 2 篇 软件工程
    • 1 篇 网络空间安全
  • 3 篇 管理学
    • 3 篇 管理科学与工程(可...
  • 1 篇 经济学
    • 1 篇 应用经济学

主题

  • 3 篇 动作值函数
  • 2 篇 深度强化学习
  • 1 篇 企业财务会计数据
  • 1 篇 差分隐私
  • 1 篇 深度确定性策略梯...
  • 1 篇 实时策略性游戏
  • 1 篇 自注意力机制
  • 1 篇 指数滑动平均
  • 1 篇 马尔可夫决策过程
  • 1 篇 值分解
  • 1 篇 动作值网络
  • 1 篇 多智能体协作
  • 1 篇 智能体
  • 1 篇 数据安全共享
  • 1 篇 转移概率矩阵
  • 1 篇 多步竞争网络

机构

  • 2 篇 合肥工业大学
  • 1 篇 北京交通大学
  • 1 篇 安徽审计职业学院

作者

  • 1 篇 戴小凤
  • 1 篇 厉子凡
  • 1 篇 申翔翔
  • 1 篇 朱卫东
  • 1 篇 方宝富
  • 1 篇 王浩

语言

  • 3 篇 中文
检索条件"主题词=动作值函数"
3 条 记 录,以下是1-10 订阅
排序:
一种基于多步竞争网络的多智能体协作方法
收藏 引用
计算机工程 2022年 第5期48卷 74-81页
作者: 厉子凡 王浩 方宝富 合肥工业大学计算机与信息学院 合肥230601
多智能体高效协作是多智能体深度强化学习的重要目标,然而多智能体决策系统中存在的环境非平稳、维数灾难等问题使得这一目标难以实现。现有分解方法可在环境平稳性和智能体拓展性之间取得较好平衡,但忽视了智能体策略网络的重要性,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
深度强化学习在实时策略游戏中的应用研究
深度强化学习在实时策略游戏中的应用研究
收藏 引用
作者: 申翔翔 北京交通大学
学位级别:硕士
近年来,深度学习不仅促进图像检测、语音识别和自然语言处理等领域的发展,而且使得强化学习领域的研究成果取得新突破。深度强化学习发展以后,在视频小游戏上取得超越人类水平的成绩,“围棋专家”阿尔法狗和阿尔法元也展示出超强的才能... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于差分隐私的企业财务会计数据安全共享方法研究
收藏 引用
通化师范学院学报 2023年 第4期44卷 88-94页
作者: 戴小凤 朱卫东 安徽审计职业学院工程管理系 安徽合肥230601 合肥工业大学 合肥工业大学管理学院
针对现有财务会计数据共享中存在开销较大、隐私安全性较低等问题,提出一种基于差分隐私的企业财务会计数据安全共享方法.通过差分隐私技术构建强化学习的形式化模型,在建模过程中引入马尔可夫决策过程,确定会计数据状态,并获得对应最... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论