交替方向乘子法与深度强化学习的资源分配
Resource Allocation Based on Alternating Direction Multiplier Method and Deep Reinforcement Learning Algorithm作者机构:南京邮电大学通信与信息工程学院南京210003
出 版 物:《北京邮电大学学报》 (Journal of Beijing University of Posts and Telecommunications)
年 卷 期:2022年第45卷第6期
页 面:122-126页
核心收录:
学科分类:080904[工学-电磁场与微波技术] 0810[工学-信息与通信工程] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 081001[工学-通信与信息系统]
主 题:密集型网络 模型驱动 资源分配 深度强化学习 交替方向乘子法
摘 要:针对有限信道状态信息下密集型网络资源分配的问题,提出将交替方向乘子法与深度强化学习算法相结合的模型驱动学习框架。区别于数据驱动框架,利用所提框架能够根据具体问题进行一对一建模。建模内容包括基站选择、功率和子载波分配,并用交替方向乘子法进行交替优化;用深度强化学习算法优化权重,求解目标函数,提高了算法的性能;利用有效信道状态信息而非多余信息,降低了通信开销;加强对最低用户服务质量的要求,在保证用户具有良好体验的情况下使小区的频谱效率最大化。仿真结果表明,在较少的迭代次数下,利用所提框架可使小区用户的频谱效率收敛,达到最大值。