基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统的建模研究方法在应用于无人水面艇集群时会遇到复杂的动态海洋环境问题,提出了一种新的多智能体马尔可夫决策过程控制框架,将一致性控制和势博弈理论结合起来.在强化学习过程中,通过映射每个智能体的动作-价值函数值(Q值)表到全局最大势函数表,从而得到最优联合决策矩阵用于协同控制.进行了仿真试验,根据平均回报值给出了分析结果,验证了控制器决策矩阵的自优化性,以及对于较大环境扰动的自适应性.
推荐文章
基于键值存储的元数据集群副本一致性研究
分布式文件系统
副本一致性
键值存储
元数据
基于RBF积分滑模的无人艇集群协同路径跟踪控制
无人艇
集群
协同路径跟踪
视线制导
积分滑模
自适应径向基函数
无人艇集群最优协同控制反演
无人艇集群
最优协同控制
反演优化
耦合代数黎卡提方程
带参改进一致性算法在多无人机集结任务的应用
一致性算法
集结问题
多无人机系统
状态差值
收敛速度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进强化学习的无人艇集群一致性控制
来源期刊 华中科技大学学报(自然科学版) 学科 交通运输
关键词 无人艇 集群控制 一致性 强化学习 势博弈
年,卷(期) 2019,(9) 所属期刊栏目 控制工程
研究方向 页码范围 42-47
页数 6页 分类号 U664.1
字数 语种 中文
DOI 10.13245/j.hust.190908
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曾凡明 海军工程大学动力工程学院 105 494 12.0 14.0
2 陈于涛 海军工程大学动力工程学院 19 60 4.0 6.0
3 曹诗杰 海军工程大学动力工程学院 6 27 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (85)
共引文献  (94)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(9)
  • 参考文献(0)
  • 二级参考文献(9)
2006(11)
  • 参考文献(0)
  • 二级参考文献(11)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(10)
  • 参考文献(1)
  • 二级参考文献(9)
2010(8)
  • 参考文献(1)
  • 二级参考文献(7)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(5)
  • 参考文献(0)
  • 二级参考文献(5)
2016(11)
  • 参考文献(4)
  • 二级参考文献(7)
2017(3)
  • 参考文献(0)
  • 二级参考文献(3)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
无人艇
集群控制
一致性
强化学习
势博弈
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华中科技大学学报(自然科学版)
月刊
1671-4512
42-1658/N
大16开
武汉市珞喻路1037号
38-9
1973
chi
出版文献量(篇)
9146
总下载数(次)
26
总被引数(次)
88536
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导