咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于强化学习的公交站场服务中断防治策略 收藏

基于强化学习的公交站场服务中断防治策略

A Resistance Strategy for Bus Service Disruption in DepotBased on Reinforcement Learning

作     者:伦嘉铭 姜海明 谢康 LUN Jia-ming;JIANG Hai-ming;XIE Kang

作者机构:广东工业大学机电工程学院广东广州510006 

出 版 物:《计算机仿真》 (Computer Simulation)

年 卷 期:2024年第41卷第4期

页      面:129-135,425页

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

基  金:国家自然科学基金项目(11874126)、广东省“领军人才”项目(400180001) 

主  题:公交服务中断 实时控制 强化学习 近端策略优化 无效动作遮蔽 

摘      要:为缓解公交站场的服务中断问题,提出一种基于强化学习的动态发车控制策略。策略利用长短期记忆(LSTM)模型对公交行程时间进行预测,使智能体感知站场车辆与运行车辆的车头时距状态,以更好地评估决策的长期影响。针对站场无车可发的场景,在计算动作概率分布时应用状态相关可微函数将无效动作遮蔽,避免智能体下发无效指令。通过奖励函数对大发车间隔进行惩罚,并使用近端策略优化(PPO)对模型进行训练。仿真结果表明,与传统方法相比,所提方法不仅能有效避免公交站场服务中断,而且使车辆载客率更均衡,乘客等待时间更少,车辆利用效率更高。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分