咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进TD3的自动驾驶车道保持决策方法 收藏

基于改进TD3的自动驾驶车道保持决策方法

Lane keeping decision-making method of autonomous vehicles based on improved TD3

作     者:田康 于镝 李擎 张宏昌 吴迎年 范玲玲 TIAN Kang;YU Di;LI Qing;ZHANG Hongchang;WU Yingnian;FAN Lingling

作者机构:北京信息科技大学自动化学院北京100192 清华大学自动化学院北京100084 

出 版 物:《北京交通大学学报》 (JOURNAL OF BEIJING JIAOTONG UNIVERSITY)

年 卷 期:2022年第46卷第5期

页      面:84-94页

学科分类:08[工学] 0835[工学-软件工程] 0802[工学-机械工程] 080201[工学-机械制造及其自动化] 

基  金:国家自然科学基金(61803036) 

主  题:深度强化学习 车道保持 TD3 多数据融合 注意力机制 经验回放: 

摘      要:本文提出基于改进TD3算法的车道保持端到端决策新方案.首先,构建多数据融合TD3算法框架,感知自主车辆运动学数据信息和视觉图像信息来提升算法的稳定性.并且结合注意力机制思想细化图像特征,使得算法关注重要道路信息,以此增强算法可解释性.其次,综合考虑驾驶的安全性、舒适性和效率性因素设计了指导型奖励函数,以引导智能体学到更加类人的驾驶策略.最后,采用分类与高价值优先级经验回放方法,以提高样本利用率和加快算法收敛速度.借助TORCS仿真平台,设计了多组对比实验,以验证所提方法的有效性和可行性;并且通过多个场景的仿真测试,验证了改进TD3算法的整体性能优于TD3算法.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分