基于近端策略优化算法的燃料电池混合动力系统综合价值损耗最小能量管理方法
Comprehensive Value Depletion Minimization Energy Management Method for Fuel Cell Hybrid Systems Based on Proximal Policy Optimization Algorithm作者机构:西南交通大学电气工程学院四川省成都市610031 中国铁道科学研究院集团有限公司机车车辆研究所北京市海淀区100081
出 版 物:《中国电机工程学报》 (Proceedings of the CSEE)
年 卷 期:2024年第44卷第12期
页 面:4788-4798,I0015页
核心收录:
基 金:国家自然科学基金项目(52377123) 四川省自然科学基金项目(2022NSFSC0027) 中国国家铁路集团有限公司科研开发计划重点课题(N2021J030)
主 题:燃料电池混合动力系统 深度强化学习 综合价值损耗 近端策略优化算法 能量管理
摘 要:为了降低市域动车组燃料电池混合动力系统运行燃料经济成本,提升燃料电池耐久性,该文提出一种基于近端策略优化算法的能量管理方法。该方法将混合动力系统能量管理问题建模为马尔可夫决策过程,以综合考虑燃料经济性和燃料电池耐久性的综合价值损耗最小为优化目标设置奖励函数,采用一种收敛速度较快的深度强化学习算法—近端策略优化算法求解,实现负载功率在燃料电池和锂电池间的合理有效分配,最后,采用市域动车组实际运行工况进行实验验证。实验结果表明,在训练工况下,所提方法相较基于等效氢耗最小能量管理方法和基于Q-learning能量管理方法,综合价值损耗分别降低19.71%和5.87%;在未知工况下,综合价值损耗分别降低18.05%和13.52%。结果表明,所提方法能够有效降低综合价值损耗,并具有较好的工况适应性。