基于强化学习的多路口可变车道协同控制方法
Cooperative control algorithm of multi-intersection variable-direction lanes based on reinforcement learning作者机构:浙江大学计算机科学与技术学院浙江杭州310027 中南大学计算机学院湖南长沙410012
出 版 物:《浙江大学学报(工学版)》 (Journal of Zhejiang University:Engineering Science)
年 卷 期:2022年第56卷第5期
页 面:987-994,1005页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:可变导向车道 强化学习 多智能体 自适应控制 智能交通
摘 要:为了解决传统的可变导向车道控制方法无法适应多路口场景下的复杂交通流的问题,提出基于多智能体强化学习的多路口可变导向车道协同控制方法来缓解多路口的交通拥堵状况.该方法对多智能体强化学习(QMIX)算法进行改进,针对可变导向车道场景下的全局奖励分配问题,将全局奖励分解为基本奖励与绩效奖励,提高了拥堵场景下对车道转向变化的决策准确性.引入优先级经验回放算法,以提升经验回放池中转移序列的利用效率,加速算法收敛.实验结果表明,本研究所提出的多路口可变导向车道协同控制方法在排队长度、延误时间和等待时间等指标上的表现优于其他控制方法,能够有效协调可变导向车道的策略切换,提高多路口下路网的通行能力.