基于改进DDPG算法的无人船自主避碰决策方法
作者机构:大连海事大学航海学院
出 版 物:《中国舰船研究》 (Chinese Journal of Ship Research)
年 卷 期:2025年
学科分类:08[工学] 082402[工学-轮机工程] 0824[工学-船舶与海洋工程] 082401[工学-船舶与海洋结构物设计制造]
基 金:国家自然科学基金(51409033 52171342)
主 题:DDPG算法 无人船 自主避碰决策 优先经验回放 国际海上避碰规则
摘 要:[目的]为了实现更加安全、高效的海上交通,提出一种基于改进的深度确定性策略梯度(DDPG)算法的无人船自主避碰决策方法。[方法]针对传统DDPG算法数据利用率低、收敛性差的特点,利用优先经验回放(PER)自适应调节经验优先级,降低样本的相关性,并利用长短期记忆(LSTM)网络提高算法的收敛性。基于船舶领域和《国际海上避碰规则》(COLREGs),设置会遇情况判定模型和一组新定义的奖励函数,并考虑紧迫危险以应对他船不遵守规则的情况。为了验证所提方法的有效性,在两船和多船会遇局面下进行仿真实验。[结果]实验结果表明,改进的DDPG算法相比于传统DDPG算法在收敛速度上提升约28.8%,[结论]训练好的自主避碰模型可以在使无人船遵守COLREGs的同时实现自主决策和导航,从而为海上交通领域的智能化决策提供参考。