基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对二连杆机械臂的运动控制问题,提出了一种基于深度强化学习的控制方法.首先,搭建机械臂仿真环境,包括二连杆机械臂、目标物与障碍物;然后,根据环境模型的目标设置、状态变量和奖罚机制来建立三种深度强化学习模型进行训练,最后实现二连杆机械臂的运动控制.对比分析所提出的三种模型后,选择深度确定性策略梯度(DDPG)算法进行进一步研究来改进其适用性,从而缩短机械臂模型的调试时间,顺利避开障碍物到达目标.实验结果表明,所提深度强化学习方法能够有效控制二连杆机械臂的运动,改进后的DDPG算法控制模型的收敛速度提升了两倍并且收敛后的稳定性增强.相较于传统控制方法,所提深度强化学习控制方法效率更高,适用性更强.
推荐文章
基于模糊CMAC的三连杆机械臂的最优控制器
模糊CMAC神经网络
H-J-B最优化
神经网络自适应算法
鲁棒性
基于Simulink的二杆机械臂的运动学仿真
机械臂建模
Simulink
运动学仿真
混合驱动平面五连杆机构优化设计与迭代学习控制
混合驱动平面五连杆机构
优化设计
迭代学习控制
轨迹跟踪
考虑关节非线性的串联双连杆机械臂工业机器人运动控制
关节非线性
双连杆
机械臂
工业机器人
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的二连杆机械臂运动控制方法
来源期刊 计算机应用 学科
关键词 深度强化学习 二连杆机械臂 运动控制 奖罚机制 深度确定性策略梯度算法
年,卷(期) 2021,(6) 所属期刊栏目 前沿与综合应用|Frontier and comprehensive applications
研究方向 页码范围 1799-1804
页数 6页 分类号 TP241.2|TP391.9
字数 语种 中文
DOI 10.11772/j.issn.1001-9081.2020091410
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (0)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(8)
  • 参考文献(4)
  • 二级参考文献(4)
2018(2)
  • 参考文献(0)
  • 二级参考文献(2)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度强化学习
二连杆机械臂
运动控制
奖罚机制
深度确定性策略梯度算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导