空地协作组网的无人机位置部署及能量优化机制研究
作者单位:河南大学
学位级别:硕士
导师姓名:周毅
授予年度:2019年
主 题:空地协同组网 无人机 位置部署 能量优化 深度强化学习
摘 要:由于无人机的灵活移动性、自主协调性和快速组网能力,其在智能交通系统等领域中有着较高应用价值。由无人机群组成的空中自组织网络(flying ad-hoc network,FANET)能够为地面车辆自组织网络(Vehicular ad hoc networks,VANET)提供无间隙的、多维度的灵活无线覆盖,从而增强地面交通网络的响应能力和应急能力。然而,无人机和车辆节点的快速拓扑变化给网络覆盖及优化带来了严峻挑战,加之无人机受续航能力限制,合理的网络部署显得尤为重要。本文针对上述多目标的非线性优化问题,同时考虑低复杂度需求,提出了空地协作组网下的无人机位置部署及能量优化机制,主要研究内容如下:(1)提出了空地一体化协作组网架构,并利用区域填充理论研究该架构下多无人机的位置部署方法。通过无人机与无人机、无人机与云计算中心、无人机与车辆之间的协同交互,优化无人机的时空3D位置以实现无人机群的最佳覆盖。由于FANET和VANET均为动态的时变系统,需要根据实际环境以及用户需求,并满足路径损失的前提下,确定并更新无人机的位置,实现无人机的覆盖范围最优化,以便为VANET网络提供更好的网络覆盖率和更高的数据传输率。(2)利用帕累托最优权衡研究了空地协同组网下多无人机的能量优化机制。无人机消耗的能量包括通信能量和移动能量,无人机的移动能耗与其部署高度成正比例关系,通信能耗却与部署高度成反比。结果,无人机通信能耗的减少以移动能耗的增加为代价,这导致空地协同组网中的能量权衡。为了表征这种权衡,推导出无人机的通信能量消耗和移动能量消耗模型。利用帕累托最优权衡,能够得到两种不同的无人机速度,以及在不同的数据传输要求下移动能耗和通信能耗的帕累托边界。(3)提出了基于强化深度学习的无人机位置—能量联合优化机制。利用深度Q-learning体现深度学习的感知能力和强化学习的决策能力,根据无人机的当前覆盖和运动状态预测其下一步动作,设置无人机的能效作为奖励函数,对执行这一动作的成本进行评价。以低复杂度、低成本的方式引导无人机自主决策,部署最佳位置,促使无人机的有效覆盖、能量消耗和能源效率这三方面的性能得到提升。最后,搭建了基于深度强化学习的无人机与车辆交互的仿真验证平台,对所提出的多无人机位置及能量联合优化机制进行仿真实现和对比分析。仿真结果表明,与最优运输理论和粒子群算法相比,深度强化学习(deep reinforcement learning,DRL)算法在无人机的平均覆盖率、平均总能耗和平均能源效率三方面性能都有明显提高。