基于DRL和轨迹优化的多机器人导航和编队维护
Multi-robot navigation and formation maintenance based on DRL and trajectory optimization作者机构:复旦大学工程与应用技术研究院上海200433
出 版 物:《传感器与微系统》 (Transducer and Microsystem Technologies)
年 卷 期:2023年第42卷第9期
页 面:129-132页
学科分类:08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程]
基 金:上海市科学技术委员会重大专项资助项目(2021SHZDZX0103) 教育部高等教育科学研究中心资助项目(2021ITA10013)。
摘 要:本文提出了一种基于深度强化学习(DRL)和轨迹优化的方法来实现避障导航同时保持编队。定义了基于图论的可微队形度量,并将其与DRL相结合,提出了一种新的近端策略优化联合轨迹优化(PPOTO)的算法。多个机器人共享策略,通过由DRL得到的马尔可夫决策模型生成预测轨迹,并通过编队度量进行优化,最终由机器人对该轨迹进行跟踪。在生成的随机地图上进行了大量的测试实验,结果表明:所提方法可以实现多机器人的编队和导航的任务,并且相对端到端的PPO算法有着明显的性能提升。