柠檬酸三钙中和过程的强化学习优化控制
作者机构:江南大学轻工过程先进控制教育部重点实验室 江苏国信协联能源有限公司 江南大学粮食发酵工艺与技术国家工程研究中心
出 版 物:《化工学报》 (CIESC Journal)
年 卷 期:2025年
核心收录:
学科分类:12[管理学] 081703[工学-生物化工] 08[工学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 0817[工学-化学工程与技术] 0835[工学-软件工程] 0802[工学-机械工程] 0836[工学-生物工程] 082203[工学-发酵工程] 0822[工学-轻工技术与工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 080201[工学-机械制造及其自动化]
主 题:三钙中和过程 优化控制 深度确定性策略算法 基于模型的强化学习 长短期记忆
摘 要:三钙中和过程是柠檬酸提取工艺的重要工序,是影响柠檬酸成品质量、产品收率的关键工段。该过程具有时滞、无参考轨迹、初始物料变化大、反应不可逆等特点,传统控制算法很难对其进行优化控制。针对上述问题,用强化学习算法深度确定性策略(DDPG)对实际的三钙中和过程进行优化控制。考虑到基于模型的强化学习方法可使智能体在学习的模型中进行无成本的探索,建立三钙中和过程的长短期记忆(LSTM)模型,并对其损失函数进行改进,减小了仿真模型与实际环境的差距,然后利用该模型进行强化学习训练,并将训练好的控制策略用于实际三钙中和过程。实验结果表明,该方法可以将仿真训练出的最优策略成功应用于实际三钙中和过程,并取得较好的结果。