基于PPO的机械臂控制研究方法

郭坤; 武曲; 张义

文献导航

搜索文章

搜索思路

基于PPO的机械臂控制研究方法

作者：

郭坤武曲张义

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

强化学习

机械臂

近端策略优化算法

Actor-Critic算法

离线学习

摘要：

目前应用于机械臂控制中有许多不同的算法,如传统的自适应PD控制、模糊自适应控制等,这些大多需要基于数学模型。也有基于强化学习的控制方法,如:DQN(Deep Q Network)、Sarsa等。但这些强化学习算法在连续高维的动作空间中存在学习效率不高、回报奖励设置困难、控制效果不佳等问题。论文对基于PPO(Proximal Policy Optimization近端策略优化)算法实现任意位置的机械臂抓取应用进行研究,并将实验数据与Actor-Critic(演员-评论家)算法的进行对比,验证了使用PPO算法的控制效果良好,学习效率较高且稳定。

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

其它

电脑知识与技术：学术版2021年第6期电脑知识与技术：学术版2021年第5期电脑知识与技术：学术版2021年第4期电脑知识与技术：学术版2021年第3期电脑知识与技术：学术版2021年第2期电脑知识与技术：学术版2021年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	基于PPO的机械臂控制研究方法
来源期刊	电脑知识与技术:学术版	学科	工学
关键词	强化学习机械臂近端策略优化算法 Actor-Critic算法离线学习
年，卷（期）	2021,（4）	所属期刊栏目
研究方向		页码范围	222-225
页数	4页	分类号	TP301
字数		语种
DOI