基于强化学习的公交站场服务中断防治策略
A Resistance Strategy for Bus Service Disruption in DepotBased on Reinforcement Learning作者机构:广东工业大学机电工程学院广东广州510006
出 版 物:《计算机仿真》 (Computer Simulation)
年 卷 期:2024年第41卷第4期
页 面:129-135,425页
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:国家自然科学基金项目(11874126)、广东省“领军人才”项目(400180001)
主 题:公交服务中断 实时控制 强化学习 近端策略优化 无效动作遮蔽
摘 要:为缓解公交站场的服务中断问题,提出一种基于强化学习的动态发车控制策略。策略利用长短期记忆(LSTM)模型对公交行程时间进行预测,使智能体感知站场车辆与运行车辆的车头时距状态,以更好地评估决策的长期影响。针对站场无车可发的场景,在计算动作概率分布时应用状态相关可微函数将无效动作遮蔽,避免智能体下发无效指令。通过奖励函数对大发车间隔进行惩罚,并使用近端策略优化(PPO)对模型进行训练。仿真结果表明,与传统方法相比,所提方法不仅能有效避免公交站场服务中断,而且使车辆载客率更均衡,乘客等待时间更少,车辆利用效率更高。