咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度强化学习和信息论的多智能体通信方法 收藏

基于深度强化学习和信息论的多智能体通信方法

作     者:高兵 张哲婕 邹启杰 刘治国 赵锡玲 

作者机构:大连大学通信与网络重点实验室 大连大学信息工程学院 

出 版 物:《航空学报》 (Acta Aeronautica et Astronautica Sinica)

年 卷 期:2024年

核心收录:

学科分类:12[管理学] 0810[工学-信息与通信工程] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 081001[工学-通信与信息系统] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61673084) 2021年辽宁省教育厅项目(LJKZ1180) 

主  题:多智能体深度强化学习 互信息 显式通信 信息瓶颈理论 合作环境 

摘      要:在合作环境的多智能体系统中,有效地进行显式通信可以提高智能体间的协作能力。但现有的通信策略往往将智能体的局部观测值直接作为通信内容,且通信对象通常是按照某种拓扑结构固定的,其结果一方面难以适应任务和环境变化而引起通信过程的不确定性;另一方面,通信对象和通信信息缺乏侧重点会造成通信带宽的资源浪费导致通信效率较低。针对上述多智能体通信协同问题,本文提出一种融合深度强化学习和信息论的方法来实现多智能体自适应显式通信机制。本方法采用先验网络使智能体动态地选择通信的对象;再利用互信息的约束和信息瓶颈理论有效过滤冗余信息;最后,汇总自身及接收到的信息推理出更有效的通信内容。本文通过合作导航和交通路口实验环境证明了该方法对比其它方法提高了多智能体系统的交互效率和合作稳定性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分