咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进DDPG算法的无人船自主避碰决策方法 收藏

基于改进DDPG算法的无人船自主避碰决策方法

作     者:关巍 郝淑慧 崔哲闻 王淼淼 

作者机构:大连海事大学航海学院 

出 版 物:《中国舰船研究》 (Chinese Journal of Ship Research)

年 卷 期:2025年

学科分类:08[工学] 082402[工学-轮机工程] 0824[工学-船舶与海洋工程] 082401[工学-船舶与海洋结构物设计制造] 

基  金:国家自然科学基金(51409033 52171342) 

主  题:DDPG算法 无人船 自主避碰决策 优先经验回放 国际海上避碰规则 

摘      要:[目的]为了实现更加安全、高效的海上交通,提出一种基于改进的深度确定性策略梯度(DDPG)算法的无人船自主避碰决策方法。[方法]针对传统DDPG算法数据利用率低、收敛性差的特点,利用优先经验回放(PER)自适应调节经验优先级,降低样本的相关性,并利用长短期记忆(LSTM)网络提高算法的收敛性。基于船舶领域和《国际海上避碰规则》(COLREGs),设置会遇情况判定模型和一组新定义的奖励函数,并考虑紧迫危险以应对他船不遵守规则的情况。为了验证所提方法的有效性,在两船和多船会遇局面下进行仿真实验。[结果]实验结果表明,改进的DDPG算法相比于传统DDPG算法在收敛速度上提升约28.8%,[结论]训练好的自主避碰模型可以在使无人船遵守COLREGs的同时实现自主决策和导航,从而为海上交通领域的智能化决策提供参考。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分