基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对工业液压机械臂末端控制精度受惯性和摩擦等因素影响的问题,提出了一种基于深度强化学习的机械臂控制方法.首先,在机器人操作系统环境下搭建仿真机械臂并进行控制和通信模块设计.然后,对深度确定性策略梯度(DDPG)算法中的Actor-Critic网络进行设计,并基于机械臂逆运动学与深度强化学习奖励机制,设计了一种包含精度指标的分层奖励函数,促进DDPG算法收敛.最后,采用改进的DDPG算法与仿真机械臂交互训练,获得机械臂控制模型,从而实现对机械臂末端的精确控制.试验结果表明:改进的DDPG算法收敛速度提升了约14.54%,在仿真环境下机械臂可以达到6 mm的末端位置控制精度,多点测试完成率最高达到90%.
推荐文章
基于强化学习的机械臂关节高精度控制方法研究
柔性关节
强化学习
高斯过程
高效学习
深度逆向强化学习研究综述
深度学习
强化学习
深度逆向强化学习
面向轨迹规划的深度强化学习奖励函数设计
深度强化学习
机械臂
轨迹规划
方位奖励函数
基于深度强化学习的机器人手臂控制
深度强化学习
深度确定性策略梯度学习算法
机器人手臂控制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种深度强化学习的机械臂控制方法
来源期刊 河南科技大学学报(自然科学版) 学科 工学
关键词 机械臂 深度强化学习 DDPG 控制精度
年,卷(期) 2021,(3) 所属期刊栏目 机械与仪表
研究方向 页码范围 19-24
页数 6页 分类号 TP241
字数 语种 中文
DOI 10.15926/j.cnki.issn1672-6871.2021.03.004
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (34)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1952(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(10)
  • 参考文献(0)
  • 二级参考文献(10)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(4)
  • 参考文献(2)
  • 二级参考文献(2)
2016(6)
  • 参考文献(1)
  • 二级参考文献(5)
2017(10)
  • 参考文献(1)
  • 二级参考文献(9)
2018(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(5)
  • 参考文献(4)
  • 二级参考文献(1)
2020(2)
  • 参考文献(1)
  • 二级参考文献(1)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机械臂
深度强化学习
DDPG
控制精度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河南科技大学学报(自然科学版)
双月刊
1672-6871
41-1362/N
大16开
河南省洛阳市开元大道263号
36-285
1980
chi
出版文献量(篇)
3214
总下载数(次)
7
总被引数(次)
19453
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导