咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于强化学习的倒立摆分数阶梯度下降RBF控制 收藏

基于强化学习的倒立摆分数阶梯度下降RBF控制

Reinforcement learning based fractional gradient descent RBF neural network control of inverted pendulum

作     者:薛晗 邵哲平 方琼林 刘晓佳 XUE Han;SHAO Zhe-ping;FANG Qiong-lin;LIU Xiao-jia

作者机构:集美大学航海学院福建厦门361021 

出 版 物:《控制与决策》 (Control and Decision)

年 卷 期:2021年第36卷第1期

页      面:125-134页

核心收录:

学科分类:0820[工学-石油与天然气工程] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(51579114) 福建省自然科学基金项目(2018J05085). 

主  题:强化学习 径向基神经网络 倒立摆 分数阶 梯度下降 神经网络控制 

摘      要:为了提高强化学习的控制性能,提出一种基于分数梯度下降RBF神经网络的强化学习算法.通过评价神经网络和执行神经网络组成强化学习系统,利用神经网络记忆和联想,学会控制倒立摆,提高控制精度,使误差趋于零,直至学习成功,并证明闭环系统的稳定性.通过倒立摆的物理实验发现,当分数阶阶数较大,微分的作用更显著,对角速度和速度的控制效果更好,角速度和速度的均方误差和平均绝对误差较小;当分数阶阶数较小,积分的作用更显著,对倾斜角和位移的控制效果更好,因此倾斜角和位移的均方误差和平均绝对误差较小.仿真实验的结果表明,所提算法动态响应好,超调量小,调整时间短,精度高,泛化性能好.它优于基于RBF神经网络的强化学习算法和传统强化学习算法,能有效地加快梯度下降法的收敛速度,提高其控制性能.在引入适当的干扰后,所提算法能够快速地自我调节并恢复稳定状态,控制器的鲁棒性和动态性能满足实际要求.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分