基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了实现水下机器人在跟踪复杂轨迹时具有较高的精度和稳定性,提出了利用深度强化学习实现水下机器人最优轨迹控制的方法:首先,建立基于2个深度神经网络(Actor网络和Critic网络)的水下机器人控制模型,其中Actor网络用来选择动作,Critic网络用来评估Actor网络的训练结果;其次,构造合适的奖励信号使得深度强化学习算法适用于水下机器人的动力学模型;最后,提出了基于奖励信号标准差的网络训练成功评判条件,使得水下机器人在确保精度的同时保证稳定性.仿真实验结果表明:在解决一定精度内的水下机器人复杂轨迹跟踪问题时,该算法与传统PID控制算法相比具有更优的性能.
推荐文章
基于增强学习控制器的仿生水下机器人姿态镇定研究
增强学习控制器
仿生水下机器人
姿态镇定
6自由度水下机器人运动轨迹滑模控制
司:水下机器人
建模
滑模控制
非线性系统
动力定位
基于传感网络的水下机器人控制器设计
水下机器人
避障系统
神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的水下机器人最优轨迹控制
来源期刊 华南师范大学学报(自然科学版) 学科 工学
关键词 深度强化学习 深度神经网络 水下机器人 轨迹跟踪 运动控制
年,卷(期) 2018,(1) 所属期刊栏目 计算机科学与软件工程
研究方向 页码范围 118-123
页数 6页 分类号 TP242|TP181
字数 5254字 语种 中文
DOI 10.6054/j.jscnun.2018037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马琼雄 华南师范大学信息光电子科技学院 2 9 1.0 2.0
2 余润笙 华南师范大学信息光电子科技学院 1 8 1.0 1.0
3 石振宇 华南师范大学信息光电子科技学院 1 8 1.0 1.0
4 黄晁星 华南师范大学信息光电子科技学院 1 8 1.0 1.0
5 李腾龙 华南师范大学信息光电子科技学院 1 8 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (8)
同被引文献  (24)
二级引证文献  (1)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(5)
  • 引证文献(5)
  • 二级引证文献(0)
2020(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
深度强化学习
深度神经网络
水下机器人
轨迹跟踪
运动控制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华南师范大学学报(自然科学版)
双月刊
1000-5463
44-1138/N
16开
广州市石牌华南师范大学
1956
chi
出版文献量(篇)
2704
总下载数(次)
9
总被引数(次)
15292
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导