基于自注意力深度强化学习的特定流路由选择算法
Specific flow routing selection algorithm based on Self-Attention deep reinforcement learning作者机构:南京邮电大学通信与信息工程学院南京210003 深圳赛柏特通信技术有限公司广东深圳518000
出 版 物:《光通信技术》 (Optical Communication Technology)
年 卷 期:2024年第48卷第3期
页 面:7-12页
学科分类:0810[工学-信息与通信工程] 08[工学] 081001[工学-通信与信息系统]
基 金:国家自然科学青年基金项目(62301284)资助 南京邮电大学企业委托研发重点课题(KH0020322072)资助
主 题:软件定义网络 多智能体深度强化学习 流量工程 负载均衡
摘 要:为了有效降低传统流量工程机制中重路由对网络带来的负面影响,基于软件定义网络的全局网络视角和管理能力,提出一种基于自注意力深度强化学习的特定流路由选择算法,以重新路由少量流量达到接近最优的性能。通过多尺度融合注意力机制的神经网络模型来提取流量的特征,并采用集中式训练-分布式执行架构,根据观测网络状态做出实时决策。理论研究和实验结果表明,与传统深度强化学习算法与启发式算法相比,所提算法在平均负载和端到端延迟性能方面均有显著改进。