基于多目标深度强化学习的多波束卫星动态波束调度算法研究-南通市图书馆

文献详情 >基于多目标深度强化学习的多波束卫星动态波束调度算法研究收藏

基于多目标深度强化学习的多波束卫星动态波束调度算法研究

作者：张雨晨

作者单位：北京邮电大学

学位级别：硕士

导师姓名：王卫东

授予年度：2020年

学科分类：08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0811[工学-控制科学与工程]

主题：多波束卫星动态波束调度差异化业务多目标深度强化学习时分动作选择

摘要：卫星通信系统具备广泛的覆盖范围和强大的通信能力,作为补充地面移动通信系统不足的通信技术而受到广泛的关注。在考虑差异化服务的固有不确定性以及容量请求的非均匀空间分布时,必须灵活调整卫星资源以满足不同的需求。其中,多波束卫星通过调度多个高增益的窄波束实现覆盖更大区域的目的,能有效降低卫星的有效负载并提高卫星系统性能,在提高通信质量和数据传输速率方面起着至关重要的作用,因此受到研究人员的广泛关注。如何将系统容量需求与波束的有效利用相匹配是一项全新的挑战。常规波束调度方法忽略了决策之间的内在相关性,不考虑长期回报,仅能在当前时间获得最优解。另外,随着对差异化业务分类需求和波束数量的增加,系统计算复杂性显着增加。为了应对这些挑战,本文研究了 DVB-S2X多波束卫星波束调度的最优策略,对以下两个问题进行了深入研究。第一,传统的动态波束调度算法仅考虑当前时刻的最优解,忽略了波束调度的内在关联,强化学习满足序贯决策的特征,能够满足卫星场景动态未知的条件。研究室已提出基于深度强化学习的动态波束调度算法,但仅考虑了单业务的时延优化。无线信道条件下,针对高通量通信卫星中差异化业务需求随机性带来的非全局优化问题,提出了一种基于多目标深度强化学习的动态波束调度算法,可实现不同业务类型QoS不同的场景下,协同优化多个目标。在DVB-S2X卫星条件下仿真获得评估结果表明,本文提出的算法能够实现智能地分配资源以适应用户需求和信道条件,与现有算法相比,所提出的的算法能在业务到达率极不平衡的条件下,实现小区之间时延的公平性,并能保证实时业务平均传输时延最小及非实时业务传输的吞吐量最大。第二,传统深度Q学习网络通常面临动作空间大的问题,研究室已提出的算法中,动作选择的方式仅能选择次优解。针对卫星波束调度过程存在的波束选择维度灾难难题,提出了一种基于双环学习的时分多动作选择方法,可实现多波束的动态选择以满足用户需求。通过理论计算,该方法在大规模波束场景下,降低了计算复杂度。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于多目标深度强化学习的多波束卫星动态波束调度算法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于多目标深度强化学习的多波束卫星动态波束调度算法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：