咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于安全强化学习的不确定二阶系统模型参考跟踪控制 收藏

基于安全强化学习的不确定二阶系统模型参考跟踪控制

Model-reference Tracking Control of Uncertain Second-order Systems Based on Safe Reinforcement Learning

作     者:胡一帆 刘克新 付俊杰 温广辉 HU Yifan;LIU Kexin;FU Junjie;WEN Guanghui

作者机构:东南大学数学学院江苏南京210096 北京航空航天大学自动化科学与电气工程学院北京100191 紫金山实验室江苏南京211111 

出 版 物:《控制工程》 (Control Engineering of China)

年 卷 期:2024年第31卷第1期

页      面:80-87页

学科分类:0711[理学-系统科学] 07[理学] 08[工学] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 071102[理学-系统分析与集成] 081103[工学-系统工程] 

基  金:空间智能控制技术重点实验室开放基金资助项目(6142208200301) 国家自然科学基金面上项目(62173085,62073079) 

主  题:安全强化学习 避障 鲁棒控制障碍函数 不确定系统 跟踪控制 

摘      要:针对带有不确定性动态的二阶系统模型参考轨迹跟踪控制问题,设计了一种基于鲁棒控制障碍函数的安全强化学习算法。该算法能在学习跟踪控制器的过程中保证系统避障。首先,对具有安全约束的轨迹跟踪控制强化学习问题进行建模。其次,利用高斯过程模型对未知系统动力学的估计,得到鲁棒的避障控制障碍函数条件,在该条件下得到概率意义下的系统安全性保证。最后,提出基于鲁棒控制障碍函数的安全强化学习算法,得到最优模型参考轨迹跟踪控制律。仿真结果验证了所提算法的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分