原文服务方: 海洋技术学报       
摘要:
首先对已有的无人遥控有缆水下机器人(Remotely Operated Vehicle,ROV)运动控制算法进行简要介绍,并对强化学习算法中的深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)的基本原理进行了阐述;然后针对DDPG算法应用于ROV运动控制时所存在的学习时间长且难以收敛,造成大量的数据浪费而增加了存储开销,降低了神经网络的泛化能力导致实用性降低等问题,提出了基于融合监督学习的监督式DDPG算法;最后进行了仿真实验,结果证明改进型DDPG算法比常规的DDPG算法更加有效。
推荐文章
深度学习无监督学习算法研究
无监督
k-均值聚类
主成分
基于无监督学习的行人检测算法
行人检测
无监督
稀疏编码
非线性变换
非极大值抑制
修正Gibbs采样的有限混合模型无监督学习算法
无监督学习
有限混合模型
参数维数变化
跳变
分布元管理
基于非监督学习的入侵分析新方法
入侵检测
非监督学习
机器学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合监督学习的小型ROV强化学习算法研究
来源期刊 海洋技术学报 学科 农学
关键词 监督学习;ROV;强化学习
年,卷(期) 2025,(6) 所属期刊栏目
研究方向 页码范围 104-111
页数 8页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2025(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
监督学习;ROV;强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
海洋技术学报
双月刊
1003-2029
12-1435/P
大16开
1982-01-01
chi
出版文献量(篇)
2588
总下载数(次)
0
总被引数(次)
15625
论文1v1指导