咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于GPR和深度强化学习的分层人机协作控制 收藏

基于GPR和深度强化学习的分层人机协作控制

Hierarchical Human-robot Cooperative Control Based on GPR and Deep Reinforcement Learning

作     者:金哲豪 刘安东 俞立 JIN Zhe-Hao;LIU An-Dong;YU Li

作者机构:浙江工业大学信息工程学院杭州310023 

出 版 物:《自动化学报》 (Acta Automatica Sinica)

年 卷 期:2022年第48卷第9期

页      面:2352-2360页

核心收录:

学科分类:12[管理学] 08[工学] 0402[教育学-心理学(可授教育学、理学学位)] 0303[法学-社会学] 0710[理学-生物学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 080202[工学-机械电子工程] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 0802[工学-机械工程] 0714[理学-统计学(可授理学、经济学学位)] 0835[工学-软件工程] 0701[理学-数学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:NSFC-浙江两化融合联合基金(U1709213) 国家自然科学基金(61973275)资助 

主  题:深度强化学习 高斯过程回归 人体控制策略感知 分层人机协作 

摘      要:提出了一种基于高斯过程回归与深度强化学习的分层人机协作控制方法,并以人机协作控制球杆系统为例检验该方法的高效性.主要贡献是:1)在模型未知的情况下,采用深度强化学习算法设计了一种有效的非线性次优控制策略,并将其作为顶层期望控制策略以引导分层人机协作控制过程,解决了传统控制方法无法直接应用于模型未知人机协作场景的问题;2)针对分层人机协作过程中人未知和随机控制策略带来的不利影响,采用高斯过程回归拟合人体控制策略以建立机器人对人控制行为的认知模型,在减弱该不利影响的同时提升机器人在协作过程中的主动性,从而进一步提升协作效率;3)利用所得认知模型和期望控制策略设计机器人末端速度的控制律,并通过实验对比验证了所提方法的有效性.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分