咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于DRL和轨迹优化的多机器人导航和编队维护 收藏

基于DRL和轨迹优化的多机器人导航和编队维护

Multi-robot navigation and formation maintenance based on DRL and trajectory optimization

作     者:朱继伟 张隆源 王冀 罗佳宁 李伟 ZHU Jiwei;ZHANG Longyuan;WANG Ji;LUO Jianing;LI Wei

作者机构:复旦大学工程与应用技术研究院上海200433 

出 版 物:《传感器与微系统》 (Transducer and Microsystem Technologies)

年 卷 期:2023年第42卷第9期

页      面:129-132页

学科分类:08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 

基  金:上海市科学技术委员会重大专项资助项目(2021SHZDZX0103) 教育部高等教育科学研究中心资助项目(2021ITA10013)。 

主  题:多机器人导航 编队控制 深度强化学习 轨迹优化 

摘      要:本文提出了一种基于深度强化学习(DRL)和轨迹优化的方法来实现避障导航同时保持编队。定义了基于图论的可微队形度量,并将其与DRL相结合,提出了一种新的近端策略优化联合轨迹优化(PPOTO)的算法。多个机器人共享策略,通过由DRL得到的马尔可夫决策模型生成预测轨迹,并通过编队度量进行优化,最终由机器人对该轨迹进行跟踪。在生成的随机地图上进行了大量的测试实验,结果表明:所提方法可以实现多机器人的编队和导航的任务,并且相对端到端的PPO算法有着明显的性能提升。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分