异构网络中基于深度强化学习的用户关联与资源分配策略
Strategy of user association and resource allocation based on deep reinforcement learning in heterogeneous networks作者机构:南京信息工程大学电子与信息工程学院南京210044 无锡学院江苏省集成电路可靠性技术及检测系统工程研究中心无锡214105
出 版 物:《国外电子测量技术》 (Foreign Electronic Measurement Technology)
年 卷 期:2024年第43卷第4期
页 面:39-47页
学科分类:0810[工学-信息与通信工程] 08[工学] 081001[工学-通信与信息系统]
基 金:国家自然科学基金(61661018) 江苏省基础研究计划青年基金(BK20210064) 无锡市科技创新创业资金(WX03-02B0137-022200-34)项目资助
主 题:深度强化学习 用户关联 资源分配 能量效率 频谱效率
摘 要:由于异构网络非凸性和组合性的特点,联合用户关联和资源分配来实现能量效率(energy efficiency, EE)和频谱效率(spectral efficiency, SE)同时最大化的最优全局策略仍然是非常具有挑战性的。基于深度强化学习(deep reinforcement learning, DRL)的方法成为在保证异构网络下行链路用户设备(user equipments, UEs)服务质量(quality of service, QoS)的同时实现联合EE-SE性能最大化的必要解决方案。此外,为解决状态-动作空间下计算量大的问题,引入了多智能体架构的深度强化学习算法(MAD3QN)来获得近乎最优控制策略。仿真结果表明,MAD3QN算法在系统容量方面比DDQN算法和DQN算法分别提高了9.2%和18.2%,在联合EE-SE性能方面分别提高了8.5%和16.6%,提升了系统的有效性。