基于深度强化学习的机械臂控制方法
Robot Arm Control Method Based on Deep Reinforcement Learning作者机构:北京市复杂产品先进制造系统工程技术研究中心北京仿真中心北京100854 复杂产品智能制造系统技术国家重点实验室北京电子工程总体研究所北京100854 航天系统仿真重点实验室北京仿真中心北京100854
出 版 物:《系统仿真学报》 (Journal of System Simulation)
年 卷 期:2019年第31卷第11期
页 面:2452-2457页
学科分类:08[工学] 081203[工学-计算机应用技术] 0802[工学-机械工程] 0825[工学-航空宇航科学与技术] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:深度强化学习在环境中不断探索尝试,通过奖励函数对神经网络参数进行调节。实际的生产线无法作为算法的试错环境,不能提供足够的数据,构建一个机械臂仿真环境,包括机械臂与物体两部分,根据目标设置状态变量与奖励机制,在模型中对深度确定性策略梯度算法(Deep Deterministic Policy Gradient, DDPG)进行训练,实现通过深度强化学习算法控制机械臂,将抓手移动至物体下方,改进控制算法的适应性,缩短调试时间。实验结果表明,深度学习算法能够在更短的时间内达到收敛,实现对机械臂的控制。