一种基于Q-Learning的蜂窝网络中D2D通信资源分配策略
A Q-learning-based resource allocation strategy for D2D communications underlaying cellular networks作者机构:南京林业大学信息科学技术学院南京210037
出 版 物:《江苏科技大学学报(自然科学版)》 (Journal of Jiangsu University of Science and Technology:Natural Science Edition)
年 卷 期:2021年第35卷第3期
页 面:64-68页
学科分类:080904[工学-电磁场与微波技术] 0810[工学-信息与通信工程] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 081001[工学-通信与信息系统]
基 金:国家自然科学基金资助项目(61801225) 南京林业大学引进高层次人才和高层次留学回国人员科研基金资助项目(GXL015)
主 题:D2D通信 强化学习 马尔可夫决策 Q学习 资源分配
摘 要:为了缓解频谱资源压力,提高频谱利用率,将D2D通信技术引入现有的通信系统,从而提高通信系统的吞吐量,降低时延以及提高频谱资源的利用率.从资源分配的角度研究了D2D接入传统蜂窝网络方案,提出多Agent共同决策算法,该算法将每对D2D用户看作一个Agent,参与到马尔科夫决策中,并通过Q学习算法进行求解.通过仿真验证,在学习率为0.7时,D2D对的接入可以在有限的频谱资源上有效地提高系统的吞吐量,缩短达到最大吞吐量的时间.