文献详情 >喷气驱动航天器姿态控制强化学习算法及实验收藏

喷气驱动航天器姿态控制强化学习算法及实验

Reinforcement Learning-based Attitude Control for Spacecraft with Reaction Jets:Theory and Experiment

作者：杜德嵩刘延芳袁秋帆赵福友齐乃明 DU Desong;LIU Yanfang;YUAN Qiufan;ZHAO Fuyou;QI Naiming

作者机构：哈尔滨工业大学航天学院哈尔滨150001 上海宇航系统工程研究所上海201109

出版物：《宇航学报》 (Journal of Astronautics)

年卷期：2024年第45卷第6期

页面：903-913页

核心收录：

学科分类：0711[理学-系统科学] 08[工学] 0708[理学-地球物理学] 081105[工学-导航、制导与控制] 0816[工学-测绘科学与技术] 0825[工学-航空宇航科学与技术] 0811[工学-控制科学与工程]

基　　金：国家重点研发计划(2022YFB3902701) 国家自然科学基金(52272390) 黑龙江省自然科学基金优秀青年项目(YQ2022A009)

主　　题：强化学习姿态控制李雅普诺夫函数半物理仿真

摘要：针对喷气驱动航天器在推力幅值受限条件下的姿态控制问题,提出一种姿态控制强化学习算法。该算法包含两个神经网络,即控制策略网络和李雅普诺夫神经网络。其中,控制策略网络直接以喷气推力器的推力作为输出,训练数据中推力满足幅值约束条件,隐式地解决推力分配优化和控制量饱和问题;设计姿态控制强化学习算法,并引入基于样本数据的航天器姿态稳定性定理,保证学习得到的控制策略的稳定性。仿真结果表明,与主流的强化学习算法和传统姿态控制方法相比,所提出的姿态控制算法在敏捷性方面表现出显著优势。此外,将控制策略移植到半物理仿真平台,控制策略能够有效完成航天器的大角度机动任务,从而证明了通过所提出的姿态控制算法训练得到的控制策略具有良好的泛化性和鲁棒性。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

喷气驱动航天器姿态控制强化学习算法及实验

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

喷气驱动航天器姿态控制强化学习算法及实验

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：