基于强化学习的倒立摆分数阶梯度下降RBF控制
Reinforcement learning based fractional gradient descent RBF neural network control of inverted pendulum作者机构:集美大学航海学院福建厦门361021
出 版 物:《控制与决策》 (Control and Decision)
年 卷 期:2021年第36卷第1期
页 面:125-134页
核心收录:
学科分类:0820[工学-石油与天然气工程] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(51579114) 福建省自然科学基金项目(2018J05085).
主 题:强化学习 径向基神经网络 倒立摆 分数阶 梯度下降 神经网络控制
摘 要:为了提高强化学习的控制性能,提出一种基于分数梯度下降RBF神经网络的强化学习算法.通过评价神经网络和执行神经网络组成强化学习系统,利用神经网络记忆和联想,学会控制倒立摆,提高控制精度,使误差趋于零,直至学习成功,并证明闭环系统的稳定性.通过倒立摆的物理实验发现,当分数阶阶数较大,微分的作用更显著,对角速度和速度的控制效果更好,角速度和速度的均方误差和平均绝对误差较小;当分数阶阶数较小,积分的作用更显著,对倾斜角和位移的控制效果更好,因此倾斜角和位移的均方误差和平均绝对误差较小.仿真实验的结果表明,所提算法动态响应好,超调量小,调整时间短,精度高,泛化性能好.它优于基于RBF神经网络的强化学习算法和传统强化学习算法,能有效地加快梯度下降法的收敛速度,提高其控制性能.在引入适当的干扰后,所提算法能够快速地自我调节并恢复稳定状态,控制器的鲁棒性和动态性能满足实际要求.