基于深度强化学习模型TD3优化和改进的电动汽车制动能量回收策略研究
作者机构:湖南工业大学电气与信息工程学院 湖南省电传动控制与智能装备重点实验室 中国航发南方工业有限公司
出 版 物:《控制与决策》 (Control and Decision)
年 卷 期:2025年
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0807[工学-动力工程及工程热物理] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划项目(2019YFE0122600) 湖南省教育厅重点科研项目(22A0423) 湖南省自然科学基金项目(2023JJ60267,2022JJ50073)
主 题:制动能量回收 电动汽车 制动策略 深度强化学习 策略梯度 经验回放
摘 要:双电机驱动电动汽车能够实现前后独立转矩分配,进而可以获得更高的能量回收效率.本文针对双电机驱动电动汽车,提出一种基于双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm, TD3)进行改进优化的制动能量回收策略.该策略能在保障制动安全性和舒适性的同时,实现制动能量回收的最大化.首先,构建了基于深度强化学习(Deep Reinforcement Learning, DRL)的能量回收决策框架,并设计了一个综合考虑能量回收效果、安全性和舒适性的奖励函数.然后,采用TD3算法求解该决策过程,并提出了改进的优先经验回放机制,以加速策略的收敛速度.最后,本文引入了平衡探索的噪声策略,增强算法探索与利用的能力.通过Matlab/Simulink平台验证,所提出的算法在满足制动安全性和舒适性的前提下,能够更高效地分配制动力,有效地提高了制动能量回收效率.