多智能体编队控制中的迁移强化学习算法研究
Study on learning algorithm of transfer reinforcement for multi-agent formation control作者机构:西北工业大学自动化学院陕西西安710129
出 版 物:《西北工业大学学报》 (Journal of Northwestern Polytechnical University)
年 卷 期:2023年第41卷第2期
页 面:389-399页
核心收录:
学科分类:0711[理学-系统科学] 07[理学] 08[工学] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 071102[理学-系统分析与集成] 081103[工学-系统工程]
基 金:国家自然科学基金(61790552 62073264)资助
主 题:多智能体系统 迁移强化学习 值函数近似 编队控制 高斯聚类
摘 要:针对多障碍环境下的多智能体系统协同编队避障与防撞问题,提出一种迁移学习与强化学习相结合的编队控制算法。在源任务学习阶段,利用值函数近似方法避免Q-表格求解法所需的大规模存储空间问题,有效降低对存储空间的需求,提升算法求解速度;在目标任务学习阶段,采用高斯聚类算法对源任务进行分类,根据聚类中心和目标任务之间的距离,选择最优的源任务类进行目标任务学习,有效避免了负迁移现象,进而提升了强化学习算法的泛化能力及收敛速度。仿真实验结果表明,所提方法能使多智能体系统在复杂的障碍环境下有效地形成并保持编队构型,同时实现避障与防撞。