咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于强化学习的地基光学望远镜阵列控制方法 收藏
基于强化学习的地基光学望远镜阵列控制方法

基于强化学习的地基光学望远镜阵列控制方法

作     者:贾奇伟 

作者单位:太原理工大学 

学位级别:硕士

导师姓名:贾鹏

授予年度:2023年

学科分类:08[工学] 0804[工学-仪器科学与技术] 

主      题:时域天文学 望远镜阵列 计算机仿真 强化学习 神经网络 

摘      要:时域天文学研究具有可变亮度或位置的天体,它可以揭示宇宙中最有趣的现象,如黑洞或致密星的行为、系外行星或近地天体。因为其中一些现象会在很短的时间内发生变化,所以天文学家需要每隔一段时间对整个天空进行预定深度的观测,以捕捉天体发出的信号。为了满足科学要求,人们提出了许多不同的巡天项目。这些巡天项目一般有两个主要的观测要求:观测间隔(cadence)和观测深度(depth)。在整个巡天项目成本不变的情况下,需要在这两个要求之间做出权衡。在光学波段,不同位置的几台望远镜可以组成一个分布式望远镜阵列,连续捕捉天体的图像。然而,相对于每晚数以百万计需要观测的天体,执行观测任务的望远镜是有限的。此外,有许多不同的因素会限制地面光学望远镜阵列的观测能力,如云、卫星和天空背景。为了满足观测要求,需要根据环境的遥测数据主动控制望远镜阵列中的望远镜,即:根据科学要求和观测条件的动态变化实时优化望远镜阵列的观测策略。本文提出了一个新的框架,包括一个望远镜阵列观测仿真环境和基于深度强化学习的望远镜观测策略优化框架。望远镜阵列观测仿真环境能够高保真模拟望远镜阵列的功能和属性,以及影响望远镜观测能力的环境因素,包括但不限于日月、各类天体、天球、云层和风等的属性及其动态变化的规律。通过神经网络强大的拟合能力,基于深度强化学习的望远镜观测策略框架可以在给定的观测要求和观测环境信息下给出对应的观测策略。为测试算法的性能,本文分别研究了基于天文目标的望远镜阵列调度策略和基于天球分区的望远镜阵列调度策略。对应这两个场景,本文分别做进行了研究。研究1为空间碎片监测网络控制方法研究,要求望远镜阵列在一定时间内搜寻环境中未知的空间碎片并对已知的空间碎片进行周期性监测。研究2为巡天望远镜阵列观测调度算法研究,要求望远镜阵列在云层、低轨卫星等动态因素的干扰下高效率的完成巡天观测。本文分别利用DQN算法和分布式强化学习算法在观测仿真环境中控制望远镜阵列完成以上两个场景的仿真实验并验证算法的性能表现。结果表明,本文提出的框架在针对于目标和针对天区的观测策略都能获得相较于传统策略的更好的结果。本文的研究成果是一种能够为分布式望远镜阵列提供有效的观测策略优化的框架。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分