咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >智能网联汽车基于逆强化学习的轨迹规划优化机制研究 收藏

智能网联汽车基于逆强化学习的轨迹规划优化机制研究

Research on Inverse Reinforcement Learning-Based Trajectory Planning Optimization Mechanism for Autonomous Connected Vehicles

作     者:彭浩楠 唐明环 查奇文 王聪 王伟达 PENG Haonan;TANG Minghuan;ZHA Qiwen;WANG Cong;WANG Weida

作者机构:中国工业互联网研究院北京100102 北京理工大学机械与车辆学院北京100081 

出 版 物:《北京理工大学学报》 (Transactions of Beijing Institute of Technology)

年 卷 期:2023年第43卷第8期

页      面:820-831页

核心收录:

学科分类:082304[工学-载运工具运用工程] 08[工学] 080204[工学-车辆工程] 0802[工学-机械工程] 0823[工学-交通运输工程] 

基  金:国家自然科学基金资助项目(51575043,U1564210,U1764257) 中国工业互联网研究院自主科研资助项目(KFZY2023C01) 

主  题:智能网联汽车 逆强化学习 轨迹规划 最大熵原则 

摘      要:针对当前轨迹规划策略存在实时性差、优化目标权重系数难以标定、模仿学习方法可解释性差等问题,提出了基于最大熵原则的逆强化学习方法,通过学习经验驾驶员驾驶轨迹的内在优化机制,从而规划出符合人类驾驶经验的整体最优的换道专家轨迹,为解决轨迹规划方法的实时性问题和可解释性问题奠定了理论基础.以一般风险场景和高风险场景为应用案例,通过Matlab/Simulink仿真验证了所提逆强化学习方法实现轨迹规划的可行性与有效性.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分