基于DQN的车辆驾驶行为决策方法
A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm作者机构:武汉理工大学自动化学院武汉430070 武汉理工大学智能交通系统研究中心武汉430063
出 版 物:《交通信息与安全》 (Journal of Transport Information and Safety)
年 卷 期:2020年第38卷第5期
页 面:67-77,112页
学科分类:082304[工学-载运工具运用工程] 08[工学] 0823[工学-交通运输工程]
基 金:国家重点研发计划项目(2017YFB0102500) 湖北省创新群体项目(2017CFA008)资助
摘 要:针对传统DQN算法下网联车驾驶行为决策的动作选择过程随机性强、探索空间大的问题,研究了结合专家知识和DQN算法的智能车辆决策框架,设计了奖励值函数来引导算法的训练。通过层次分析法(AHP)选取高速场景下车辆驾驶决策中的重要影响因素,利用ID3决策树构建简单而有效的专家规则库;在传统算法基础上,通过设计奖励值函数来优化DQN网络结构,由奖励值函数引导DQN算法来解决高速场景下的车辆决策问题,并在Python仿真环境中构建高速交通场景对该算法进行分析和验证。实验结果表明,在高速直道和并道场景下,达到95%成功率的平均训练次数分别减少了100次和200次,平均奖励值分别提高了4.02和1.34,有效加快了DQN算法的动作选择,降低了探索过程中的动作随机性。