基于强化学习的并行任务实时调度方法
REAL-TIME SCHEDULING OF PARALLEL TASKS BASED ONREINFORCEMENT LEARNING作者机构:复旦大学计算机科学技术学院上海200438
出 版 物:《计算机应用与软件》 (Computer Applications and Software)
年 卷 期:2024年第41卷第7期
页 面:239-245,341页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家电网公司科技项目(SGBJDKOODWJS2000117)
摘 要:针对现有并行任务调度算法大多未考虑环境的不稳定性以及缺少通用性、实时性等问题,提出一种基于强化学习的并行任务实时调度方法。将任务调度建模为一个马尔可夫决策过程,通过智能体与环境的交互,使用近端策略优化方法。其中,使用仿真方法来构造奖励函数,并通过降噪自编码器为优势估计函数添加经验项,使得智能体能够学习到高效且可靠的调度策略。两个场景下的仿真对比实验结果表明,采用该方法比现有方法提升时间利用率超过17%,提高产出超过16%,能够在毫秒级时间内实时调度。