咨询与建议

限定检索结果

文献类型

  • 9 篇 学位论文
  • 6 篇 期刊文献

馆藏范围

  • 15 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 15 篇 工学
    • 14 篇 控制科学与工程
    • 14 篇 计算机科学与技术...
    • 14 篇 软件工程
    • 3 篇 机械工程
    • 3 篇 仪器科学与技术
    • 1 篇 公安技术
    • 1 篇 网络空间安全
  • 14 篇 管理学
    • 14 篇 管理科学与工程(可...

主题

  • 15 篇 值函数分解
  • 6 篇 注意力机制
  • 4 篇 深度强化学习
  • 3 篇 强化学习
  • 3 篇 多智能体系统
  • 3 篇 多智能体强化学习
  • 3 篇 分层强化学习
  • 3 篇 多智能体深度强化...
  • 2 篇 路径规划
  • 2 篇 可扩展性
  • 1 篇 收敛效果
  • 1 篇 技能发现
  • 1 篇 推荐系统
  • 1 篇 动态分配目标
  • 1 篇 信息论优化
  • 1 篇 异质智能体
  • 1 篇 多机器人追捕
  • 1 篇 策略梯度
  • 1 篇 移动机器人
  • 1 篇 收敛性

机构

  • 2 篇 重庆理工大学
  • 1 篇 军事科学院国防科...
  • 1 篇 太原理工大学
  • 1 篇 南京信息工程大学
  • 1 篇 山东潍坊烟草有限...
  • 1 篇 大连海事大学
  • 1 篇 北京邮电大学
  • 1 篇 青岛大学
  • 1 篇 四川大学
  • 1 篇 山东省工业控制重...
  • 1 篇 西安工业大学
  • 1 篇 哈尔滨工业大学
  • 1 篇 大连民族大学
  • 1 篇 陆军工程大学
  • 1 篇 大连大学
  • 1 篇 军事科学院
  • 1 篇 西安理工大学
  • 1 篇 哈尔滨工程大学

作者

  • 2 篇 张泽崴
  • 2 篇 高玉钊
  • 1 篇 赵星懋
  • 1 篇 赖俊
  • 1 篇 聂一鸣
  • 1 篇 曹雷
  • 1 篇 高兵
  • 1 篇 思荣轩
  • 1 篇 杨旭
  • 1 篇 李文雪
  • 1 篇 纪龙
  • 1 篇 付成伟
  • 1 篇 赵锡玲
  • 1 篇 李琛
  • 1 篇 崔丹
  • 1 篇 邹启杰
  • 1 篇 张建勋
  • 1 篇 熊丽琴
  • 1 篇 周维庆
  • 1 篇 张汝波

语言

  • 15 篇 中文
检索条件"主题词=值函数分解"
15 条 记 录,以下是1-10 订阅
排序:
基于值函数分解的多智能体深度强化学习方法研究综述
收藏 引用
计算机科学 2024年 第S1期51卷 22-30页
作者: 高玉钊 聂一鸣 军事科学院国防科技创新研究院 北京100071
多智能体深度强化学习方法是深度强化学习方法在多智能体问题上的扩展,其中基于值函数分解的多智能体深度强化学习方法取得了较好的表现效果,是目前研究和应用的热点。文中介绍了基于值函数分解的多智能体深度强化学习方法的主要原理和... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于值函数分解方法的多智能体协同策略研究
基于值函数分解方法的多智能体协同策略研究
收藏 引用
作者: 纪龙 南京信息工程大学
学位级别:硕士
近几年,强化学习的发展非常迅速,尤其在Alpha Go击败围棋高手李世石之后,更是引起了众多学者的关注和研究。随着研究的不断深入,强化学习被逐渐应用到复杂的多智能体协同问题上,这类研究被称为多智能体强化学习。多智能体强化学习已经... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于值函数分解的多智能体深度强化学习围捕算法研究
基于值函数分解的多智能体深度强化学习围捕算法研究
收藏 引用
作者: 高玉钊 军事科学院
学位级别:硕士
近年来强化学习方法飞速发展,已在游戏、自动驾驶、机器人控制等领域取得许多成果。基于值函数分解的多智能体深度强化学习(Multi-Agent Reinforcement Learning Based on Value function Decomposition,VDMARL)是一类解决多智能体合作... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于加权值函数分解的多智能体分层强化学习技能发现方法
收藏 引用
计算机应用研究 2023年 第9期40卷 2743-2748,2754页
作者: 邹启杰 李文雪 高兵 赵锡玲 张汝波 大连大学信息工程学院 辽宁大连116622 大连民族大学机电工程学院 辽宁大连116600
针对目前大多数多智能体强化学习算法在智能体数量增多以及环境动态不稳定的情况下导致的维度爆炸和奖励稀疏的问题,提出了一种基于加权值函数分解的多智能体分层强化学习技能发现算法。首先,该算法将集中训练分散执行的架构与分层强化... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于分解的多智能体深度强化学习综述
收藏 引用
计算机科学 2022年 第9期49卷 172-182页
作者: 熊丽琴 曹雷 赖俊 陈希亮 陆军工程大学指挥控制工程学院 南京210007
基于分解的多智能体深度强化学习是众多多智能体深度强化学习算法中的一类,也是多智能体深度强化学习领域的一个研究热点。它利用某种约束将多智能体系统的联合动作值函数分解为个体动作函数的某种特定组合,能够有效解决多智能体系... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
多智能体深度强化学习的图像特征分类方法
收藏 引用
计算机工程与应用 2024年 第7期60卷 222-228页
作者: 张泽崴 张建勋 邹航 李林 南海 重庆理工大学计算机科学与工程学院 重庆400054
为解决在图像特征识别分类等机器学习任务中,存在输入图像数据复杂度过高且与部分数据与特征无关的问题,提出了一种多智能体深度强化学习的图像特征分类方法。将图像特征分类任务转化为一个部分可观测的马尔可夫决策过程。通过使用多个... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于深度强化学习的多智能体攻防对抗策略研究
基于深度强化学习的多智能体攻防对抗策略研究
收藏 引用
作者: 张泽崴 重庆理工大学
学位级别:硕士
多智能体系统是指由多个与环境交互的智能体组成的一个整体系统,智能体之间相互作用,通过信息交换和协调行动来达成共同的目标或解决共同的问题。深度强化学习将强化学习与深度神经网络结合在一起,大大提升了强化学习算法的特征提取能... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
非全知环境下的多智能体深度强化学习研究
非全知环境下的多智能体深度强化学习研究
收藏 引用
作者: 臧嵘 太原理工大学
学位级别:硕士
智能体通过与环境交互,利用强化学习优化策略以实现回报最大化或完成特定任务。将强化学习与深度学习结合形成深度强化学习,它不仅具备强大的特征提取能力和表达能力以感知智能体属性信息和环境信息,而且具备强大的探索能力以适应环境... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
多机器人追捕问题的研究
多机器人追捕问题的研究
收藏 引用
作者: 蓝天翔 哈尔滨工业大学
学位级别:硕士
多机器人追捕问题是研究机器人之间协调和协作的最理想的平台。将强化学习算法应用到追捕问题当中可以使多机器人系统主动的去探索环境,适应环境,从而提高自身的性能和稳定性,而直接将标准的强化学习算法直接应用于多机器人系统会使... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于强化学习的多智能体协作策略研究与应用
基于强化学习的多智能体协作策略研究与应用
收藏 引用
作者: 陈学智 西安工业大学
学位级别:硕士
随着人工智能的不断发展,深度强化学习已在单智能体领域取得显著的成果。然而,将其扩展至多智能体环境时,将会面临一系列新的问题,如环境的不稳定性,智能体间通讯效率低下,奖励难以合理分配等问题,这些问题将严重影响智能体之间的协作... 详细信息
来源: 同方学位论文库 同方学位论文库 评论