基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前应用于机械臂控制中有许多不同的算法,如传统的自适应PD控制、模糊自适应控制等,这些大多需要基于数学模型。也有基于强化学习的控制方法,如:DQN(Deep Q Network)、Sarsa等。但这些强化学习算法在连续高维的动作空间中存在学习效率不高、回报奖励设置困难、控制效果不佳等问题。论文对基于PPO(Proximal Policy Optimization近端策略优化)算法实现任意位置的机械臂抓取应用进行研究,并将实验数据与Actor-Critic(演员-评论家)算法的进行对比,验证了使用PPO算法的控制效果良好,学习效率较高且稳定。
推荐文章
柔性机械臂建模理论与控制方法研究综述
柔性机械臂
动力学建模
控制策略
基于AdaBoost算法的智能轮椅机械臂抓取控制研究
动态抓取
AdaBoost算法
串口通信
机械臂
双关节测力机械臂设计与控制方法研究
爆发力
机械臂
神经网络
运动生物力学
基于RBF神经网络的机械臂自适应控制方法
机械臂
神经网络
辨识器
自适应控制
李亚普诺夫函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于PPO的机械臂控制研究方法
来源期刊 电脑知识与技术:学术版 学科 工学
关键词 强化学习 机械臂 近端策略优化算法 Actor-Critic算法 离线学习
年,卷(期) 2021,(4) 所属期刊栏目
研究方向 页码范围 222-225
页数 4页 分类号 TP301
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
机械臂
近端策略优化算法
Actor-Critic算法
离线学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
总被引数(次)
0
论文1v1指导