PILCO框架对飞行姿态模拟器系统的参数设计与优化
Parameter design and optimization of a flight attitude simulator system based on PILCO framework作者机构:哈尔滨工业大学控制理论与制导技术研究中心黑龙江哈尔滨150001 四川航天系统工程研究所四川成都610100
出 版 物:《光学精密工程》 (Optics and Precision Engineering)
年 卷 期:2019年第27卷第11期
页 面:2365-2373页
核心收录:
学科分类:080202[工学-机械电子工程] 08[工学] 0804[工学-仪器科学与技术] 0835[工学-软件工程] 0802[工学-机械工程] 080201[工学-机械制造及其自动化]
基 金:国家自然科学基金资助项目(No.61304006 No.61273095)
摘 要:PID控制是飞行器控制中应用最广泛的控制方法,但是PID参数的调节往往十分繁琐。为了实现飞行模拟器控制系统自主优化PID控制器的参数,从而完成系统的稳定控制,本文使用强化学习中的概率推理学习控制算法(Probabilistic Inference for Learning Control,PILCO)自主优化PID控制器的参数。首先,利用输入输出数据拟合出系统的概率动力学模型,并使用策略评估的方法对当前PID控制器进行评价;最后,使用策略提升的方式对当前PID控制器进行优化。在系统采样频率为100 Hz,每次采集8 s数据的实验中,经过10个回合的离线训练之后,系统控制效果已经可以满足要求,PID控制器参数已经收敛。经过PILCO优化的飞行姿态模拟器在定点实验中表现出良好的鲁棒性,表明PILCO算法可以优化PID控制器的参数,并且在解决非线性控制和参数优化方面具有很大潜能。