基于深度强化学习的钢铁企业能源计划配置
作者机构:江南大学物联网工程学院
出 版 物:《控制工程》 (Control Engineering of China)
年 卷 期:2023年
学科分类:08[工学] 081104[工学-模式识别与智能系统] 0806[工学-冶金工程] 080601[工学-冶金物理化学] 0811[工学-控制科学与工程]
摘 要:钢铁生产具有流程长、工序繁杂、工况不确定、能源介质多等生产特性,致使面向全流程的能源介质计划配置制定难,提出了具有自适应学习能力的深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)。首先根据生产系统能源平衡机理构建能源平衡模型,然后以能源转换系统最小运行能源成本为目标函数,考虑工序上下游约束和能源供需约束等模型约束,根据能源平衡模型和目标函数搭建深度强化学习下能源优化框架,求解过程引入方差收敛的高斯噪声和动作超限惩罚函数,增加DDPG智能体搜索范围和收敛速度,使DDPG智能体在多工况下自适应调整,更新得到最优策略。最后,以实际案例的不同工况进行仿真实验,验证深度强化学习方法在能源计划配置方面的有效性。