咨询与建议

限定检索结果

文献类型

  • 8 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 12 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 12 篇 工学
    • 11 篇 计算机科学与技术...
    • 11 篇 软件工程
    • 10 篇 控制科学与工程
    • 1 篇 仪器科学与技术
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 航空宇航科学与技...
  • 10 篇 管理学
    • 10 篇 管理科学与工程(可...
  • 2 篇 军事学
    • 1 篇 战术学
    • 1 篇 军事装备学

主题

  • 12 篇 值分解
  • 7 篇 深度强化学习
  • 4 篇 多智能体强化学习
  • 3 篇 注意力机制
  • 3 篇 多智能体协作
  • 1 篇 部分可观测性
  • 1 篇 q学习
  • 1 篇 状态估计
  • 1 篇 隐式通信
  • 1 篇 竞争网络结构
  • 1 篇 联合优化
  • 1 篇 强化学习
  • 1 篇 竞争变换
  • 1 篇 合作型
  • 1 篇 迁移学习
  • 1 篇 人工智能
  • 1 篇 一致性
  • 1 篇 近端策略优化
  • 1 篇 无人机网络
  • 1 篇 信度分配

机构

  • 2 篇 军事科学院
  • 2 篇 合肥工业大学
  • 1 篇 山东省工业控制技...
  • 1 篇 北京邮电大学
  • 1 篇 青岛大学
  • 1 篇 郑州大学
  • 1 篇 西安工业大学
  • 1 篇 南京航空航天大学
  • 1 篇 陆军工程大学
  • 1 篇 南京邮电大学
  • 1 篇 哈尔滨工程大学
  • 1 篇 中国科学技术大学
  • 1 篇 中国兵器工业试验...

作者

  • 2 篇 厉子凡
  • 1 篇 傅妍芳
  • 1 篇 李俊杰
  • 1 篇 曹子建
  • 1 篇 赖俊
  • 1 篇 曹雷
  • 1 篇 张鹏
  • 1 篇 徐新海
  • 1 篇 王子磊
  • 1 篇 杨博
  • 1 篇 田辉
  • 1 篇 熊丽琴
  • 1 篇 王秋红
  • 1 篇 贺硕
  • 1 篇 邓亚男
  • 1 篇 李渊
  • 1 篇 陈希亮
  • 1 篇 闫国闯
  • 1 篇 崔浩岩
  • 1 篇 赵德京

语言

  • 12 篇 中文
检索条件"主题词=值分解"
12 条 记 录,以下是1-10 订阅
排序:
多智能体协作场景下基于强化学习值分解的计算卸载策略
收藏 引用
通信学报 2021年 第6期42卷 1-15页
作者: 张鹏 田辉 赵鹏涛 贺硕 童一帆 北京邮电大学网络与交换技术国家重点实验室 北京100876 郑州大学信息工程学院 河南郑州450001
针对未来网络中出现的多智能设备协作计算场景,提出了一种基于深度强化学习的多智能体联合计算卸载策略。所提策略通过多智能体强化学习值分解方法将多智能体联合动作策略函数拆解到各智能体设备上,达成系统的联合卸载决策,使系统在联... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于值分解的多目标多智能体深度强化学习方法
收藏 引用
计算机工程 2023年 第1期49卷 31-40页
作者: 宋健 王子磊 中国科学技术大学自动化系 合肥230027
多智能体深度强化学习方法可应用于真实世界中需要多方协作的场景,是强化学习领域内的研究热点。在多目标多智能体合作场景中,各智能体之间具有复杂的合作与竞争并存的混合关系,在这些场景中应用多智能体强化学习方法时,其性能取决于该... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于隐式通信的值分解多智能体强化学习
收藏 引用
计算机科学与探索 2024年
作者: 邓亚男 王秋红 李俊杰 顾晶晶 南京航空航天大学计算机科学与技术学院
在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在做决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
基于状态估计的值分解方法
收藏 引用
计算机科学 2023年 第8期50卷 202-208页
作者: 熊丽琴 曹雷 陈希亮 赖俊 陆军工程大学指挥控制工程学院 南京210007
值分解方法是一种流行的解决合作多智能体深度强化学习问题的方法,其核心是基于IGM(Individual-Global-Max)原则将联合函数表示为个体函数的某种组合。该方法中,智能体仅根据基于局部观察的个体函数选择动作,这导致智能体无法有... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于多智能体值分解深度强化学习的多智能体协作算法研究
基于多智能体值分解深度强化学习的多智能体协作算法研究
收藏 引用
作者: 厉子凡 合肥工业大学
学位级别:硕士
多智能体协作一直是人工智能的研究热点,有助于解决人类社会的许多问题。由于近些年来深度强化学习展现出的惊人决策能力,利用其解决多智能体协作问题成为热门,并诞生了多智能体深度强化学习这一研究方向。值分解是多智能体深度强化学... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于值分解与近端策略优化的多智能体协作研究
基于值分解与近端策略优化的多智能体协作研究
收藏 引用
作者: 马燕豪 南京邮电大学
学位级别:硕士
随着科技的进步,单个智能体解决问题的能力已经不能满足人们的需求,多智能体系统成为一个重要的研究领域。多个智能体协作协调可以完成更加复杂的任务,具有重要的研究意义。多智能体协作是多智能体系统的重要研究内容,深度强化学习的发... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
基于强化学习的无人机集群对抗策略推演仿真
收藏 引用
兵工学报 2023年 第S02期44卷 126-134页
作者: 曹子建 孙泽龙 闫国闯 傅妍芳 杨博 李秦洁 雷凯麟 高领航 西安工业大学计算机科学与工程学院 陕西西安710021 西安工业大学兵器科学与技术学院 陕西西安710021 中国兵器工业试验测试研究院 陕西华阴714200
无人机集群在军事战争、公共安全和商业领域的应用越来越广泛,但在复杂多变的对抗环境下,制定高效的策略仍然是一个挑战。为使无人机集群能够自主学习和适应对抗环境的变化,提高任务执行的效率和成功率,提出一种基于值分解的多智能体强... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于多步竞争网络的多智能体协作方法
收藏 引用
计算机工程 2022年 第5期48卷 74-81页
作者: 厉子凡 王浩 方宝富 合肥工业大学计算机与信息学院 合肥230601
多智能体高效协作是多智能体深度强化学习的重要目标,然而多智能体决策系统中存在的环境非平稳、维数灾难等问题使得这一目标难以实现。现有值分解方法可在环境平稳性和智能体拓展性之间取得较好平衡,但忽视了智能体策略网络的重要性,... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
面向博弈对抗的多智能体强化学习建模与迁移技术
收藏 引用
指挥与控制学报 2024年 第2期10卷 226-231页
作者: 李渊 刘运韬 徐新海 万珂嘉 军事科学院 北京100190
多智能体博弈对抗问题涉及智能体之间的协作配合,传统基于博弈论等方法的解决方案并不适用于复杂场景的博弈对抗问题。基于强化学习的多智能体协同训练机制是近年来的研究热点。针对中国电子科技集团发布的多智能体博弈对抗问题,设计基... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
一种基于一致性的多智能体Q学习算法
收藏 引用
控制工程 2024年 第7期31卷 1169-1177页
作者: 崔浩岩 张震 赵德京 廖登宇 青岛大学自动化学院 山东青岛266071 山东省工业控制技术重点实验室 山东青岛266071
针对多智能体系统中智能体通信能力受限和多智能体强化学习中联合动作空间维数灾难问题,提出一种基于一致性的多智能体Q学习(multi-agent Q-learning based on consensus,MAQC)算法。该算法采用集中训练-分散执行框架。在集中训练阶段,M... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 同方期刊数据库 同方期刊数据库 评论